JP5115965B2 - ニューロン装置、神経回路網装置、非負整数符号化装置、整数クラスタ装置、フィードバック制御装置、ならびに、プログラム - Google Patents

ニューロン装置、神経回路網装置、非負整数符号化装置、整数クラスタ装置、フィードバック制御装置、ならびに、プログラム Download PDF

Info

Publication number
JP5115965B2
JP5115965B2 JP2007257123A JP2007257123A JP5115965B2 JP 5115965 B2 JP5115965 B2 JP 5115965B2 JP 2007257123 A JP2007257123 A JP 2007257123A JP 2007257123 A JP2007257123 A JP 2007257123A JP 5115965 B2 JP5115965 B2 JP 5115965B2
Authority
JP
Japan
Prior art keywords
negative
signal value
output
input
negative integer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007257123A
Other languages
English (en)
Other versions
JP2009087114A (ja
Inventor
真吾 下田
英紀 木村
正明 山岡
日出輝 梶間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
RIKEN Institute of Physical and Chemical Research
Original Assignee
Toyota Motor Corp
RIKEN Institute of Physical and Chemical Research
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp, RIKEN Institute of Physical and Chemical Research filed Critical Toyota Motor Corp
Priority to JP2007257123A priority Critical patent/JP5115965B2/ja
Priority to CN2008801089833A priority patent/CN101809598B/zh
Priority to PCT/JP2008/067774 priority patent/WO2009044751A1/ja
Priority to US12/680,678 priority patent/US8620844B2/en
Publication of JP2009087114A publication Critical patent/JP2009087114A/ja
Application granted granted Critical
Publication of JP5115965B2 publication Critical patent/JP5115965B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/39Robotics, robotics to robotics hand
    • G05B2219/39031Use of model for robot and for measuring device

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Neurology (AREA)
  • Feedback Control In General (AREA)
  • Manipulator (AREA)

Description

本発明は、神経回路網においてニューロンの閾値を可変にし、ヘッブ則を拡張し、整数表現を工夫することで、適切な制御を行うのに好適なニューロン装置、神経回路網装置、非負整数符号化装置、整数クラスタ装置、フィードバック制御装置、ならびに、これらをコンピュータにて実現するプログラムに関する。
従来から、神経細胞の活動を、単純な数学的モデルに落とし込んだ仮想的な「ニューロン」を制御単位として、ニューロン同士の出力と入力を重み付きで結合し、その重みを変更することで、学習を行って、ニューラルネットワークによる制御を行う技術が提案されている。たとえば、このような技術については、以下の文献に開示されている。
下田真吾,旭岳史,藤本英雄,木村英紀「複合制御論におけるロボット制御」第11回ロボティクスシンポジア,2006年
ここで、[非特許文献1]では、バースティングモデルを利用して、神経細胞モデルの自律的活動による学習で物体を運搬する動作を学習する技術が提案されている。
しかしながら、[非特許文献1]に開示の技術に限らず、どのようなニューロンのモデルを設定すべきか、については、現在も比較検討がなされている段階であり、新たなモデルを利用したニューラルネットワークの構成に関する技術が強く望まれている。
本発明は、以上のような課題を解決するためのもので、神経回路網においてニューロンの閾値を可変にし、ヘッブ則を拡張し、整数表現を工夫することで、適切な制御を行うのに好適なニューロン装置、神経回路網装置、非負整数符号化装置、整数クラスタ装置、フィードバック制御装置、ならびに、これらをコンピュータにて実現するプログラムを提供することを目的とする。
本発明の第1の観点に係るニューロン装置は、神経細胞をシミュレートし閾値記憶部、入力受付部、出力部、閾値更新部を備え、以下のように構成する。
すなわち、閾値記憶部は、閾値変数θと、2つの閾値係数Δθ1、Δθ2と、を記憶する。
一方、入力受付部は、1つまたは複数の入力信号値の入力を、所定の時間間隔で受け付ける。
さらに、出力部は、入力を受け付けられた入力信号値の総和sが、記憶された閾値変数θの値以上であれば、当該ニューロン装置が発火しているとして1を、そうでなければ、当該ニューロン装置が休息しているとして0を、それぞれ出力信号値として出力する。
そして、閾値更新部は、出力された出力信号値Xと、記憶された閾値係数Δθ1、Δθ2と、から
Δθ1 X + Δθ2(X - 1)
を計算して、閾値記憶部に記憶される閾値変数θの値をその計算結果だけ増加するように更新する。
本発明のその他の観点に係る神経回路網装置は、重み記憶部、上記のニューロン装置2個(以下、一方を「入力側ニューロン装置」、「出力側ニューロン装置」という。)、調停入力受付部、重み更新部を備え、以下のように構成する。
すなわち、重み記憶部は、重みwと、2つの重み係数Δw1、Δw2を記憶する。
一方、調停入力受付部は、入力側ニューロン装置と、出力側ニューロン装置と、が、入力信号値の入力を受け付け、出力信号値を出力する時間間隔で、調停信号値の入力を受け付ける。
さらに、入力側ニューロンの出力信号値uに記憶される重みwを乗じた値w uは、出力側ニューロンに入力信号値として与えられる。
そして、重み更新部は、入力側ニューロン装置から出力された出力信号値uと、出力側ニューロン装置から出力された出力信号値xと、受け付けられた調停信号値zと、記憶された重み係数Δw1、Δw2と、から、
Δw1 x u z + Δw2(x u z - 1)
を計算して、重み記憶部に記憶される重みwの値をその計算結果だけ増加するように更新する。
本発明のその他の観点に係る非負整数符号化装置は、上記のニューロン装置N個、非負実数受付部、非負整数出力部を備え、以下のように構成する。
すなわち、非負実数受付部は、N個のニューロン装置が、入力信号値の入力を受け付け、出力信号値を出力する時間間隔で、1つまたは複数の非負実数信号値の入力を受け付けて、当該非負実数信号値の総和uを、N個のニューロン装置に入力信号値として与える。
一方、非負整数出力部は、N個のニューロン装置により出力される出力信号値の総和を、非負整数信号値として出力する。
さらに、N個のニューロン装置は、当該閾値変数θの初期値としてそれぞれ、1,2,…,Nを当該閾値記憶部に記憶し、N個のニューロン装置のそれぞれにおいて、当該閾値係数Δθ1、Δθ2の値として0を当該閾値記憶部に記憶する。
また、本発明の整数クラスタ装置は、上記の非負整数符号化装置2個(以下、一方を「正側符号化装置」、他方を「負側符号化装置」という。)、実数受付部、正側神経回路網、負側神経回路網、整数演算出力部を備え、以下のように構成する。
すなわち、実数受付部は、2個の非負整数符号化装置が、非負実数信号値の入力を受け付け、非負整数信号値を出力する時間間隔で、1つまたは複数の実数信号値の入力を受け付けて、当該実数信号値の総和vが、
(a)非負であれば、実数値vを、正側符号化装置に非負実数信号値として与え、0を、負側符号化装置に非負実数信号値として与え、
(b)負であれば、0を、正側符号化装置に非負実数信号値として与え、実数値-vを、負側符号化装置に非負実数信号値として与える。
そして、正側神経回路網は、正側符号化装置から出力される非負整数信号値を入力として与えられ、当該非負整数に対する演算を行う。
さらに、負側神経回路網は、負側符号化装置から出力される非負整数信号値を入力として与えられ、正側神経回路網と同一の回路構成を有する。
一方、整数演算出力部は、正側神経回路網より出力される信号値から、負側神経回路網より出力される信号値を減算した値を整数演算結果信号として出力する。
また、本発明のフィードバック制御装置は、制御入力受付部、正側フィードバック装置、負側フィードバック装置、操作出力部を備え、以下のように構成する。
すなわち、制御入力受付部は、制御対象の変位の目標値と、当該変位の観測値および当該変位の微分の観測値と、の入力を受け付ける。
一方、当該正側フィードバック装置と、当該負側フィードバック装置と、は、いずれも、
(a)上記の非負整数符号化装置A1と、
(b)上記の非負整数符号化装置A2と、
(c)上記の非負整数符号化装置A3と、
(d)重みp,k1,k2,v1,v2と、重み係数Δq1,Δq2と、を記憶する制御記憶部と、
(e)非負整数符号化装置A1から出力される非負整数信号値uに記憶される重みpを乗じた信号値p uが、実数信号値の入力として与えられる上記の非負整数符号化装置B1と、
(f)非負整数符号化装置A1から出力される非負整数信号値に記憶される重みk1を乗じた信号値と、非負整数符号化装置A2から出力される非負整数信号値に記憶される重みk2を乗じた信号値と、が、実数信号値の入力として与えられる上記の非負整数符号化装置B2と、
(g)非負整数符号化装置B1から出力される非負整数信号値に記憶される重みv1を乗じた信号値と、非負整数符号化装置B2から出力される非負整数信号値に記憶される重みv2を乗じた信号値と、が、実数信号値の入力として与えられる上記の非負整数符号化装置Cと、
(h)非負整数符号化装置Cから出力される非負整数信号値xを、操作値として出力する片側操作出力部と、
(j)非負整数符号化装置A1から出力される非負整数信号値uと、非負整数符号化装置Cから出力される非負整数信号値xと、から、
Δq1 x2 u + Δq2(x2 u - 1)
を計算し、制御記憶部に記憶される重みpを、その計算結果だけ増加するように更新する制御更新部と、
を備える。
さらに、制御入力受付部は、
(1)制御対象の変位の目標値が非負であれば、当該正側フィードバック装置の非負整数符号化装置A1に当該値を実数信号値の入力として与え、当該負側フィードバック装置の非負整数符号化装置A1に0を実数信号値の入力として与え、
(2)制御対象の変位の目標値が負であれば、当該正側フィードバック装置の非負整数符号化装置A1に0を実数信号値の入力として与え、当該負側フィードバック装置の非負整数符号化装置A1に当該値を実数信号値の入力として与え、
(3)制御対象の変位の観測値が非負であれば、当該正側フィードバック装置の非負整数符号化装置A2に当該値を実数信号値の入力として与え、当該負側フィードバック装置の非負整数符号化装置A2に0を実数信号値の入力として与え、
(4)制御対象の変位の観測値が負であれば、当該正側フィードバック装置の非負整数符号化装置A2に0を実数信号値の入力として与え、当該負側フィードバック装置の非負整数符号化装置A2に当該値を実数信号値の入力として与え、
(5)制御対象の変位の微分の観測値が非負であれば、当該正側フィードバック装置の非負整数符号化装置A3に当該値を実数信号値の入力として与え、当該負側フィードバック装置の非負整数符号化装置A3に0を実数信号値の入力として与え、
(6)制御対象の変位の微分の観測値が負であれば、当該正側フィードバック装置の非負整数符号化装置A3に0を実数信号値の入力として与え、当該負側フィードバック装置の非負整数符号化装置A3に当該値を実数信号値の入力として与える。
そして、操作出力部は、当該正側フィードバック装置より出力される操作値から、当該負側フィードバック装置より出力される操作値を減算した値を、操作出力として制御対象に与える。
また、本発明のフィードバック制御装置は、非負整数符号化装置B1,B2,Cのそれぞれにおいて、当該2つの閾値係数Δθ1、Δθ2として、0を記憶するのにかえて、
Δθ1 > 0 > Δθ2、かつ、
|Δθ1| > |Δθ2|
なる関係を満たす定数値を記憶するように構成することができる。
また、本発明のフィードバック制御装置において、当該観測対象は、K種類の目標状態を有し、当該K種類の目標状態のそれぞれには、目標値が対応付けられ、上記のニューロン装置K個をさらに備え、以下のように構成することができる。
すなわち、K個のニューロン装置と、正側フィードバック装置および負側フィードバック装置との組み合わせにおいて、観測対象の目標状態がi番目の目標状態である場合に、i番目のニューロン装置には正の入力信号値が与えられ、それ以外のニューロン装置には0の入力信号値が与えられる。
そして、K個のニューロン装置のそれぞれに対して、
(1)当該ニューロン装置に対する切替重みr1,r2,r3,r4と、切替重み係数Δs1,Δs2と、を記憶する切替重み記憶部と、
(2)当該ニューロン装置から出力される出力信号値yに記憶される重みr1を乗じた信号値が、実数信号値の入力として与えられる上記の非負整数符号化装置D1と、
(3)当該ニューロン装置から出力される出力信号値yに記憶される重みr2を乗じた信号値が、実数信号値の入力として与えられる上記の非負整数符号化装置D2と、を有し、
(4)当該非負整数符号化装置D1から出力される非負整数信号値に記憶される重みr3を乗じた信号値と、当該非負整数符号化装置D2から出力される非負整数信号値に記憶される重みr4を乗じた信号値と、は、非負整数符号化装置Cに、さらに実数信号値の入力として与えられ、
(5)当該ニューロン装置から出力される出力信号値yと、非負整数符号化装置Cから出力される非負整数信号値xと、から、
Δs1 x2 y + Δs2(x2 y - 1)
を計算し、制御記憶部に記憶される重みr1を、その計算結果だけ増加するように更新する切り替え制御更新部をさらに有する。
すなわち、状態がK個であれば、重みr1,r2,r3,r4,Δs1,Δs2のセットもK個用意され、個別に更新がなされる。
また、本発明のフィードバック制御装置は、非負整数符号化装置D1,D2のそれぞれにおいて、当該2つの閾値係数Δθ1、Δθ2として、0を記憶するのにかえて、
Δθ1 > 0 > Δθ2、かつ、
|Δθ1| > |Δθ2|
なる関係を満たす定数値を記憶するように構成することができる。
本発明のその他の観点に係るプログラムは、コンピュータを、上記のニューロン装置、神経回路網装置、非負整数符号化装置、整数クラスタ装置、フィードバック制御装置として機能させるように構成する。
また、本発明のプログラムは、コンパクトディスク、フレキシブルディスク、ハードディスク、光磁気ディスク、ディジタルビデオディスク、磁気テープ、半導体メモリ等のコンピュータ読取可能な情報記憶媒体に記録することができる。
上記プログラムは、プログラムが実行されるコンピュータやディジタル信号プロセッサとは独立して、コンピュータ通信網を介して配布・販売することができる。また、上記情報記憶媒体は、コンピュータやディジタル信号プロセッサとは独立して配布・販売することができる。
本発明によれば、神経回路網においてニューロンの閾値を可変にし、ヘッブ則を拡張し、整数表現を工夫することで、適切な制御を行うのに好適なニューロン装置、神経回路網装置、非負整数符号化装置、整数クラスタ装置、フィードバック制御装置、ならびに、これらをコンピュータにて実現するプログラムを提供することができる。
以下に本発明の実施形態を説明する。なお、以下に説明する実施形態は説明のためのものであり、本発明の範囲を制限するものではない。したがって、当業者であればこれらの各要素もしくは全要素をこれと均等なものに置換した実施形態を採用することが可能であるが、これらの実施形態も本発明の範囲に含まれる。
特に、以下の実施形態にて説明されるニューロン装置、神経回路網装置、非負整数符号化装置、整数クラスタ装置、フィードバック制御装置は、いずれも、コンピュータに所定のプログラムを実行させ、処理の制御ならびに各種の計算はCPU(Central Processing Unit)が行い、各種の記憶を記憶する領域としてRAM(Random Access Memory)を利用するようにして実現するのが典型的である。
しかしながら、基本構成要素にて実行される計算は主として四則演算や簡単な比較に限られるから、きわめて単純な電子回路で構成可能であり、当該電子回路を電子素子として実現したり、FPGA(Field Programmable Gate Array)やDSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)等の技術を適用して実現することも可能である。
以下では、ニューロン装置、神経回路網装置、非負整数符号化装置、整数クラスタ装置、フィードバック制御装置の順に、その詳細について説明する。
(ニューロン装置)
図1は、本実施形態に係るニューロン装置の概要構成を示す模式図である。以下、本図を参照して説明する。
ニューロン装置101は、神経細胞をシミュレートするものであり、閾値記憶部102、入力受付部103、出力部104、閾値更新部105を備える。
閾値記憶部102は、閾値変数θと、2つの閾値係数Δθ1、Δθ2と、を記憶する。以下、理解を容易にするため、ある時点tにおける変数θの値を示す際には、θ(t)のように表記するものとする。閾値記憶部102に記憶されるのは、変数θの最新の値、ということになる。
一方、2つの閾値係数Δθ1、Δθ2は、利用者が適宜調整可能な定数であるが、以下の2通りのいずれかの関係を有するようにするのが典型的である。ただし、これらには限られない。
(1)Δθ1 > 0 > Δθ2
(2)Δθ1 = Δθ2 = 0
さて、入力受付部103は、1つまたは複数の入力信号値の入力を、所定の時間間隔で受け付ける。所定の時間間隔で受け付けることから、時刻は整数で表現することができる。したがって、時刻tにおけるN個の入力信号値をs1(t),…,sN(t)のように表記する。
さらに、出力部104は、入力を受け付けられた入力信号値の総和sが、記憶された閾値変数θの値以上であれば、当該ニューロン装置101が発火しているとして1を、そうでなければ、当該ニューロン装置101が休息しているとして0を、それぞれ出力信号値として出力する。
入力信号値の総和sの時刻tにおける値s(t)は、
s(t) = Σi=1 N si(t)
のように表現できる。入力信号値は非負実数値をとるのが一般的であるが、これに限られない。
時刻tにおける出力信号値X(t)は、
sgm(z) = 1 (z > 0);
sgm(z) = 1 (z = 0);
sgm(z) = 0 (z < 0)
のように定義されるシグモイド関数sgm(z)によって、
X(t) = sgm(s(t) - θ(t))
のように表記することができる。
そして、閾値更新部105は、出力された出力信号値Xと、記憶された閾値係数Δθ1、Δθ2と、から
Δθ1 X + Δθ2(X - 1)
を計算して、閾値記憶部102に記憶される閾値変数θの値をその計算結果だけ増加するように更新する。
すなわち、時刻t+1におけるθの値θ(t+1)は、時刻tにおけるθの値θ(t)の値を用いて、
θ(t+1) = θ(t) + Δθ1 X(t) + Δθ2(X(t) - 1))
のように表記することができる。
このニューロン装置101を、可変閾値ニューロン(Variable Threshold Neuron;VTN)とも呼ぶ。VTNは、2つの状態をとりうる。X(t)が1のときは、VTNは発火状態にあり、X(t)が0のときは、VTNは休息状態にある。
また、閾値θ(t)は、閾値係数Δθ1、Δθ2によって変化する。VTN 101が発火しているときには、Δθ1だけ閾値θが増加し、VTN 101が休息しているときには、Δθ2だけ閾値θが増加する。
上記のように、
Δθ1 > 0 > Δθ2
のような関係がある場合には、発火状態が続くと閾値θが上昇して発火しにくくなり、休息状態が続くと閾値θが下降して発火しやすくなることになる。さらに、
|Δθ1| > |Δθ2|
とすることが多い。
また、
Δθ1 = Δθ2 = 0
である場合には、閾値は一定であることになる。
(神経回路網装置)
図2は、本実施形態に係る神経回路網装置の概要構成を示す模式図である。以下、本図を参照して説明する。
本図に示す神経回路網装置201は、ニューラルネットワークにおける重み付け更新の技術として広く知られているヘッブ則を拡張したものである。
神経回路網装置201は、重み記憶部202、ニューロン装置101を2個(以下、一方を「入力側ニューロン装置101a」、「出力側ニューロン装置101b」という。)、調停入力受付部203、重み更新部204を備える。
ここで、重み記憶部202は、重みwと、2つの重み係数Δw1、Δw2を記憶する。
一方、調停入力受付部203は、入力側ニューロン装置101aと、出力側ニューロン装置101bと、が、入力信号値の入力を受け付け、出力信号値を出力する時間間隔で、調停信号値zの入力を受け付ける。調停入力受付部203は、他のニューロン装置101に接続されるのが一般的である。
さらに、入力側ニューロン装置101aの出力信号値uに記憶される重みwを乗じた値w uが、出力側ニューロン装置101bに入力信号値として与えられる。本図では、重みwを乗じることを、矢印の横にwを表記することで示している(以下同様)。
そして、重み更新部204は、入力側ニューロン装置101aから出力された出力信号値uと、出力側ニューロン装置101bから出力された出力信号値xと、受け付けられた調停信号値zと、記憶された重み係数Δw1、Δw2と、から、
Δw1 x u z + Δw2(x u z - 1)
を計算して、重み記憶部202に記憶される重みwの値をその計算結果で更新する。時刻tを明記すると、
w(t+1) = w(t) + Δw1 x(t)u(t)z(t) + Δw2(x(t)u(t)z(t) - 1)
のように、重みが更新されることとなる。
この重み係数についても、
Δw1 > 0 > Δw2、
特に
|Δw1| > |Δw2|
とすることが多い。
図3は、本実施形態による拡張ヘッブ則によるニューロンの結合の様子を示す説明図である。以下、本図を参照して説明する。
本図では、ニューロン装置101(M)、ニューロン装置101(I)、ニューロン装置101(O)の3つが表記されているが、それぞれ、調停、入力、出力に対応しており、それぞれの出力値(状態)は、z,u,xであり、結合の重みはwである。
ニューロン装置101(I)とニューロン装置101(O)の結合が、上記の神経回路網装置201に相当する。
さて、重み係数Δw1,Δw2は、互いに符号が異なるように設定するのが典型的である。そして、
Δw1 > 0
のように設定したときには、ニューロン装置101(M)により、ニューロン装置101(I)とニューロン装置101(O)の結合が亢進(potentiation)される(本図(a))。
また、
Δw1 < 0
のように設定したときには、ニューロン装置101(M)により、ニューロン装置101(I)とニューロン装置101(O)の結合が抑制(inhibitation)される(本図(b))。抑制の場合には、その旨を明らかにするため、慣習にしたがい、ニューロン装置101(M)から出る矢印の先に棒を表記する。
なお、ニューロン装置101(M)とニューロン装置101(I)を一致させるか、もしくは、ニューロン装置101(M)とニューロン装置101(O)を一致させた場合には、古典的なヘッブ則に帰着されることになる。
(非負整数符号化装置)
図4は、本実施形態に係る非負整数符号化装置の概要構成を示す模式図である。以下、本図を参照して説明する。
本発明のその他の観点に係る非負整数符号化装置401は、上記のニューロン装置101をN個、非負実数受付部402、非負整数出力部403を備える。
すなわち、非負実数受付部402は、N個のニューロン装置101が、入力信号値の入力を受け付け、出力信号値を出力する時間間隔で、1つまたは複数の非負実数信号値の入力を受け付けて、当該非負実数信号値の総和uを、N個のニューロン装置101に入力信号値として与える。
一方、非負整数出力部403は、N個のニューロン装置101により出力される出力信号値の総和を、非負整数信号値として出力する。
さらに、N個のニューロン装置101は、当該閾値変数θの初期値としてそれぞれ、1,2,…,Nを当該閾値記憶部102に記憶し、N個のニューロン装置101のそれぞれにおいて、当該閾値係数Δθ1、Δθ2の値として0を当該閾値記憶部102に記憶する。すなわち、N個のニューロン装置101のうち、i番目のニューロン装置101の閾値θは定数iに等しい、ということになる。
N個のニューロン装置101からの出力をすべて単純に結合すれば実数値uの少数部分を切り捨てて整数化した値に相当する。
通常のニューロンのクラスタ同士の結合と同様に、ニューロン同士を完全結合(complete connection)することとしても良い。
図5は、非負整数符号化装置401を含む一般的なニューロンのクラスタの結合の様子を示す模式図である。以下、本図を参照して説明する。
本図(a)に示すように、2つのクラスタ501a(A)、501b(B)は、それぞれ、非負整数符号化装置401同様にN個のニューロン装置101を有しており、2つのクラスタ501a(A)、501b(B)の各ニューロン装置101は、互いに結合している(本図(a))。クラスタ501a(A)のi番目のニューロン装置101(Ai)とクラスタ501b(B)のj番目のニューロン装置101(Bj)は、重みw[i,j]で結合している。w[i,j]は2次元行列もしくは2次元配列に相当するもので、すべての要素が同じ定数値を持つこととしても良いし、上記のような拡張ヘッブ則に基づいて、個別に、もしくは、一括して、更新されることとしても良い。
本図(b)は、本図(a)を省略表記したものである。理解を容易にするため、クラスタ501a(A)とクラスタ501b(B)とが、重みwで結合しているかのように表記する。以下、適宜この記法を用いることとする。また、本図のような結合の様子に対しては、「クラスタ501a(A)の出力に重みwを乗じてクラスタ501b(B)に入力として与える。」のような表現を用いるものとする。したがって、一般に「wを乗じる」と言った場合には、wとしては上記のような行列/配列を意味することとなり、すべてが等しい重みの場合にはスカラーを意味することとなる。
(整数クラスタ装置)
一般に、ニューロン装置101が出力する値は「0」か「1」であるから、負の値を直接出力させることはできない。また、上記の非符号整数符号化装置401を利用しながら、負の値に対応する必要がある。以下では、このような処理を実現する整数クラスタ装置について説明する。
図6は、本実施形態に係る整数クラスタ装置の概要構成を示す模式図である。以下、本図を参照して説明する。
整数クラスタ装置601は、上記の非負整数符号化装置401を2個(以下、一方を「正側非負整数符号化装置401a」、他方を「負側非負整数符号化装置401b」という。)、実数受付部602、正側神経回路網603、負側神経回路網604、整数演算出力部605を備える。
すなわち、実数受付部602は、2個の非負整数符号化装置401が、非負実数信号値の入力を受け付け、非負整数信号値を出力する時間間隔で、1つまたは複数の実数信号値の入力を受け付ける。
そして、当該実数信号値の総和vが、
(a)非負であれば、実数値vを、正側非負整数符号化装置401aに非負実数信号値として与え、0を、負側非負整数符号化装置401bに非負実数信号値として与え、
(b)負であれば、0を、正側非負整数符号化装置401aに非負実数信号値として与え、実数値-vを、負側非負整数符号化装置401bに非負実数信号値として与える。
このようにすると、正側非負整数符号化装置401aにも負側非負整数符号化装置401bにも、正の信号値が与えられ、非負整数への符号化がなされる。
そして、正側神経回路網603と、負側神経回路網604とは、同一の回路構成を有するが、学習の如何によっては、重み等の設定が変化することがある。
そして、正側神経回路網603は、正側非負整数符号化装置401aから出力される非負整数信号値を入力として与えられ、当該非負整数に対する演算を行う。
さらに、負側神経回路網604は、負側非負整数符号化装置401bから出力される非負整数信号値を入力として与えられ、当該非負整数に対する演算を行う。
正側神経回路網603と、負側神経回路網604と、は、いずれも正の値(絶対値)の信号値を出力することとなるから、整数演算出力部605は、正側神経回路網603より出力される信号値から、負側神経回路網604より出力される信号値を減算した値を整数演算結果信号として出力する。
このように、0または正の値に対する処理はそのまま行い、負の値に対する処理は正の値に変換してから処理を行って、最後に両者の結果の差を求めて結合することで、一般的な実数に対する処理を可能とするのである。
(フィードバック制御装置)
以下では、上記のニューロン装置101、非負整数符号化装置401を用いて、神経回路網装置201と整数クラスタ装置601における原理を適用し、フィードバック制御を行うフィードバック制御装置の実施形態について説明する。
図7は、本実施形態に係るフィードバック制御装置の概要構成を示す模式図である。以下、本図を参照して説明する。
フィードバック制御装置701は、制御入力受付部702、正側フィードバック装置703、負側フィードバック装置704、操作出力部705を備える。
そして、制御入力受付部702は、制御対象の変位の目標値と、当該変位の観測値および当該変位の微分の観測値と、の入力を受け付ける。
変位およびその微分としては任意の組み合わせを採用することができる。たとえば「位置と速度」「角度と角速度」「速度と加速度」「角速度と角加速度」等の組み合わせである。
さて、当該正側フィードバック装置703と、当該負側フィードバック装置704と、は、同一の回路構成となっている。そこで本図では、理解を容易にするため、負側フィードバック装置704の詳細は図示を省略している。
さて、当該正側フィードバック装置703と、当該負側フィードバック装置704とは、いずれも、6個の非負整数符号化装置401(A1,A2,A3,B1,B2,C)、制御記憶部(図示せず)、制御更新部(図示せず)、を備える。
そして、制御記憶部は、重みp,k1,k2,v1,v2と、重み係数Δq1,Δq2を記憶する。これは、上記の各装置と同様である。
非負整数符号化装置401(B1)には、非負整数符号化装置401(A1)から出力される非負整数信号値uに記憶される重みpを乗じた信号値p uが、実数信号値の入力として与えられる。
非負整数符号化装置401(B2)には、非負整数符号化装置401(A1)から出力される非負整数信号値に記憶される重みk1を乗じた信号値と、非負整数符号化装置401(A2)から出力される非負整数信号値に記憶される重みk2を乗じた信号値と、が、実数信号値の入力として与えられる。
非負整数符号化装置401(C)には、非負整数符号化装置401(B1)から出力される非負整数信号値に記憶される重みv1を乗じた信号値と、非負整数符号化装置401(B2)から出力される非負整数信号値に記憶される重みv2を乗じた信号値と、が、実数信号値の入力として与えられる。
そして、片側操作出力部711は、非負整数符号化装置401(C)から出力される非負整数信号値xを、操作値として出力する。
さらに、制御更新部は、非負整数符号化装置401(A1)から出力される非負整数信号値uと、非負整数符号化装置401(C)から出力される非負整数信号値xと、から、
Δq1 x2 u + Δq2(x2 u - 1)
を計算し、制御記憶部に記憶される重みpを、その計算結果だけ増加するように更新する。これは、上記の各装置と同様であり、上記の拡張ヘッブ則を、非負整数符号化装置401(A1,B1)の結合に対して適用することに相当する。
このような構成を有する当該正側フィードバック装置703、当該負側フィードバック装置704に対して、制御入力受付部702は、上記の整数クラスタ装置601と同様に、正の値と負の値を適切に振り分ける。すなわち、
(1)制御対象の変位の目標値が非負であれば、当該正側フィードバック装置703の非負整数符号化装置401(A1)に当該値を実数信号値の入力として与え、当該負側フィードバック装置704の非負整数符号化装置401(A1)に0を実数信号値の入力として与え、
(2)制御対象の変位の目標値が負であれば、当該正側フィードバック装置703の非負整数符号化装置401(A1)に0を実数信号値の入力として与え、当該負側フィードバック装置704の非負整数符号化装置401(A1)に当該値を実数信号値の入力として与え、
(3)制御対象の変位の観測値が非負であれば、当該正側フィードバック装置703の非負整数符号化装置401(A2)に当該値を実数信号値の入力として与え、当該負側フィードバック装置704の非負整数符号化装置401(A2)に0を実数信号値の入力として与え、
(4)制御対象の変位の観測値が負であれば、当該正側フィードバック装置703の非負整数符号化装置401(A2)に0を実数信号値の入力として与え、当該負側フィードバック装置704の非負整数符号化装置401(A2)に当該値を実数信号値の入力として与え、
(5)制御対象の変位の微分の観測値が非負であれば、当該正側フィードバック装置703の非負整数符号化装置401(A3)に当該値を実数信号値の入力として与え、当該負側フィードバック装置704の非負整数符号化装置401(A3)に0を実数信号値の入力として与え、
(6)制御対象の変位の微分の観測値が負であれば、当該正側フィードバック装置703の非負整数符号化装置401(A3)に0を実数信号値の入力として与え、当該負側フィードバック装置704の非負整数符号化装置401(A3)に当該値を実数信号値の入力として与える。
一方、操作出力部705は、上記の整数クラスタ装置601と同様に、正側と負側で得られた値の差を用いるため、当該正側フィードバック装置703より出力される操作値から、当該負側フィードバック装置704より出力される操作値を減算した値を、操作出力として制御対象に与えるのである。
なお、本実施形態の正側フィードバック装置703、負側フィードバック装置704においては、非負整数符号化装置401(B1,B2,C)のそれぞれにおいて、当該2つの閾値係数Δθ1、Δθ2として、0を記憶するのにかえて、
Δθ1 > 0 > Δθ2、かつ、
|Δθ1| > |Δθ2|
なる関係を満たす定数値を記憶するように構成するのが典型的である。
一方、非負整数符号化装置401(A1,A2,A3)においては、単なる整数化を行うと考えられるので、
Δθ1 = Δθ2 = 0
のように設定するのが典型的である。
このほか、拡張ヘッブ則の学習を考慮して、
Δq1 > 0 > Δq2、かつ、
|Δq1| > |Δq2|
なる関係を満たす定数値を利用することが多い。
図8は、サーボモータの制御に本実施形態のフィードバック制御装置を適用した場合の学習シミュレーションの結果を示すグラフである。以下、本図を参照して説明する。
本シミュレーションは、サーボモータの角度を目標に与え、現在の角度と角速度を観測し、サーボモータに印加する電圧を操作出力とするものである。サーバモータは単純な2次システムと考えることができ、本フィードバック制御装置は、可変PD制御器として働く。
また、非負整数符号化装置401は、50個のニューロン装置101からなるものとして、所望の角度を0.5radに設定している。
本図に示すように、試行を繰り返すと制御性能は次第に改善される。制御誤差は非負整数符号化装置401(B2)において、目標値と現在の角度の差として計算され、学習は、この観点で監督(supervise)されることになる。
ただし、ここで注意しておきたいことは、誤差は、ネットワークそのもの変化には含まれない、ということである。重みと閾値の更新は、あらかじめ定められた規則にしたがって行われ、誤差には無関係である。
また、本図に示すように、発火しているVTNの数は、休息に減少していき、定数になった時点で、システムは、所望の制御レベルに達したことになる。
所望の制御レベルに達したときの発火状態にあるニューロン装置101の数は、Δθ1,Δθ2,Δq1,Δq2の値によって変化・調整が可能である。このとき、増加方向の係数Δθ1,Δq1を減少方向の係数Δθ2,Δq2の絶対値よりもかなり大きな値としておくと、望ましい学習が行われることが実験によりわかっている。
本実施形態では、上記実施形態の構成に加えて、目標状態というものを考える。
たとえば、図9に示すマニピュレータの制御について考える。以下、本図を参照して説明する。
マニピュレータ801は、腕を連結する2つの関節811、812を持っており、腕の先には荷物821が荷重される。マニピュレータ801にとって安定な姿勢とは、その重心から鉛直に伸ばした線が関節811を通過する姿勢である。
そこで、関節811の角度は自由に設定し、図10に示すようにマニピュレータ801の関節812の角度を2通りに設定する。
本図(a)は、第1の重さの荷物821を支える第1の姿勢であり、関節812の角度が設定されている。
本図(b)は、第2の重さの荷物821を支える第2の姿勢であり、関節812の角度が設定されている。
そして、2つの荷物821、822は重さが異なるから、関節812の角度は、一般には、第1の姿勢と第2の姿勢とで異なるものとなる。そして、関節811の角度は、上記のような安定の条件から自然に定められるため、明示的に与える必要はない。
このように、一連の動作の中で、通過すべき複数の姿勢を、ある程度の自由度をもったまま指定して、その一連の動作のうち、現在は何番目の姿勢に向かおうとしているのか、を示す制御信号を、フィードバック制御装置701に与えるのである。
図11は、目標状態が何番目のものであるかを示す信号を用いるフィードバック制御装置の概要構成を示す模式図である。以下、本図を参照して説明する。
本実施形態のフィードバック制御装置701は、上記のフィードバック制御装置701と共通する構成を有するため、適宜図示を省略している。また、正側と負側では構成が対称であるから、負側についても適宜図示を省略している。
フィードバック制御装置701において、当該観測対象は、K種類の目標状態を有し、当該K種類の目標状態のそれぞれには、目標値が対応付けられている。上記のマニピュレータ801のでは、姿勢は2種類あったから、K = 2となる。
そして、ニューロン装置101がK個さらに用意されている。このK個のニューロン装置101においては、観測対象の目標状態がi番目の目標状態である場合に、i番目のニューロン装置101には正の入力信号値が与えられ、それ以外のニューロン装置101には0の入力信号値が与えられる。
そして、このK個のニューロン装置101のそれぞれには、正側フィードバック装置703および負側フィードバック装置704の両方において、
(1)当該ニューロン装置101に対する切替重みr1,r2,r3,r4と、切替重み係数Δs1,Δs2と、を記憶する切替重み記憶部(図示せず)と、
(2)当該ニューロン装置101から出力される出力信号値yに記憶される重みr1を乗じた信号値が、実数信号値の入力として与えられる上記の非負整数符号化装置401(D1)と、
(3)当該ニューロン装置101から出力される出力信号値yに記憶される重みr2を乗じた信号値が、実数信号値の入力として与えられる上記の非負整数符号化装置401(D2)と、とが接続され、
(4)当該非負整数符号化装置401(D1)から出力される非負整数信号値に記憶される重みr3を乗じた信号値と、当該非負整数符号化装置401(D2)から出力される非負整数信号値に記憶される重みr4を乗じた信号値と、は、非負整数符号化装置401Cに、さらに実数信号値の入力として与えられ、
(5)当該ニューロン装置101から出力される出力信号値yと、非負整数符号化装置401(C)から出力される非負整数信号値xと、から、
Δs1 x2 y + Δs2(x2 y - 1)
を計算し、制御記憶部に記憶される重みr1を、その計算結果だけ増加するように更新する切り替え制御更新部(図示せず)と回路をなすように、構成されている。
ここで、本実施形態では、Δs1 < 0としており、抑制(inhibitation)を利用している。
また、本発明のフィードバック制御装置701においては、上記と同様に、非負整数符号化装置401(D1,D2)のそれぞれにおいて、当該2つの閾値係数Δθ1、Δθ2として、0を記憶するのにかえて、
Δθ1 > 0 > Δθ2、かつ、
|Δθ1| > |Δθ2|
なる関係を満たす定数値を記憶するように構成するのが典型的である。
あとは、目標とする姿勢の順に、その姿勢に向かう時間の間だけ、当該姿勢の順番に対応するニューロン装置101に非零の入力を与え、それ以外のニューロン装置101に0の入力を与えれば良いことになる。
現在目標状態としている姿勢のそれぞれに応じて、拡張ヘッブ則により学習がなされるため、たとえばロボットの歩行動作を実現する際には、歩行動作をいくつかのフェーズに分けて、各フェーズの境界を上記の「目標姿勢」とすることで、歩行動作の設計が容易になるとともに、各フェーズの学習を行わせることができるので、各種のパラメータ調整の手間を減らすことができると期待される。
また、あらかじめ目標軌道を与える関節(上記の関節812に相当)と、学習により軌道が定まる関節(上記の関節811に相当)を分けることで、バランスをとりながら歩行するようなニューラルネットワークが、短時間で獲得できるようになる。
なお、上記図10の例のように、状態が2つだけの場合には、第1の目標状態でなければ第2の目標状態であることになるから、目標状態を受け付けるニューロン装置101は1個で済む。
図12は、本例についてシミュレーションを行った場合の目標値の与え方を示すグラフである。本図に示すように、一定間隔で、第1の姿勢を目標とする期間と第2の姿勢を目標とする期間を入れ換える旨が指定されている。
図13は、図11に示す目標値によって学習を行った実験結果を示すグラフである。本図に示すように、時間が経過するにしたがって、姿勢が安定状態に収束していくことがわかる。
図14は、重さの異なる荷物を与えた場合の、姿勢の収束値を示すグラフである。異なる重さ、異なる初期姿勢から動作を開始したとしても、同じ収束点に収束していることがわかり、これが、このロボットにとっての最適な動作であることがわかる。
このように本発明によれば、神経回路網においてニューロンの閾値を可変にし、ヘッブ則を拡張し、整数表現を工夫することで、適切な制御を行うのに好適なニューロン装置、神経回路網装置、非負整数符号化装置、整数クラスタ装置、フィードバック制御装置、ならびに、これらをコンピュータにて実現するプログラムを提供することができる。
ニューロン装置の概要構成を示す模式図である。 神経回路網装置の概要構成を示す模式図である。 拡張ヘッブ則によるニューロンの結合の様子を示す説明図である。 非負整数符号化装置の概要構成を示す模式図である。 非負整数符号化装置を含む一般的なニューロンのクラスタの結合の様子を示す模式図である。 整数クラスタ装置の概要構成を示す模式図である。 フィードバック制御装置の概要構成を示す模式図である。 サーボモータの制御に本実施形態のフィードバック制御装置を適用した場合の学習シミュレーションの結果を示すグラフである。 制御対象となるマニピュレータの概要構成を示す模式図である。 異なる荷物が荷重されたマニピュレータの2つの姿勢を示す説明図である。 目標状態が何番目のものであるかを示す信号を用いるフィードバック制御装置の概要構成を示す模式図である。 シミュレーションにおける目標値の与え方を示すグラフである。 図12に示す目標値によって学習を行った実験結果を示すグラフである。 重さの異なる荷物を与えた場合の、姿勢の収束値を示すグラフである。
符号の説明
101 ニューロン装置
102 閾値記憶部
103 入力受付部
104 出力部
105 閾値更新部
201 神経回路網装置
202 重み記憶部
203 調停入力受付部
204 重み更新部
401 非負整数符号化装置
402 非負実数受付部
403 非負整数出力部
501 クラスタ
601 整数クラスタ装置
602 実数受付部
603 正側神経回路網
604 負側神経回路網
701 フィードバック制御装置
702 制御入力受付部
703 正側フィードバック装置
704 負側フィードバック装置
705 操作出力部
801 マニピュレータ
811 関節
812 関節
821 荷物
822 荷物

Claims (13)

  1. 神経細胞をシミュレートするニューロン装置であって、前記ニューロン装置は、
    閾値変数θと、2つの閾値係数Δθ1、Δθ2と、を記憶する閾値記憶部と、
    1つまたは複数の入力信号値の入力を、所定の時間間隔で受け付ける入力受付部と、
    前記入力を受け付けられた入力信号値の総和sが、前記記憶された閾値変数θの値以上であれば、当該ニューロン装置が発火しているとして1を、そうでなければ、当該ニューロン装置が休息しているとして0を、それぞれ出力信号値として出力する出力部と、
    前記出力された出力信号値Xと、前記記憶された閾値係数Δθ1、Δθ2と、から
    Δθ1 X + Δθ2(X - 1)
    を計算して、前記閾値記憶部に記憶される閾値変数θの値をその計算結果だけ増加するように更新する閾値更新部と、
    を備えることを特徴とするニューロン装置。
  2. 重みwと、2つの重み係数Δw1、Δw2を記憶する重み記憶部と、
    請求項1に記載のニューロン装置2個(以下、一方を「入力側ニューロン装置」、「出力側ニューロン装置」という。)と、
    前記入力側ニューロン装置と、前記出力側ニューロン装置と、が、入力信号値の入力を受け付け、出力信号値を出力する時間間隔で、調停信号値の入力を受け付ける調停入力受付部と、
    を備える神経回路網装置であって、
    前記入力側ニューロンの出力信号値uに前記記憶される重みwを乗じた値w uは、前記出力側ニューロンに入力信号値として与えられ、
    前記入力側ニューロン装置から出力された出力信号値uと、前記出力側ニューロン装置から出力された出力信号値xと、前記受け付けられた調停信号値zと、前記記憶された重み係数Δw1、Δw2と、から、
    Δw1 x u z + Δw2(x u z - 1)
    を計算して、前記重み記憶部に記憶される重みwの値をその計算結果だけ増加するように更新する重み更新部
    をさらに備えることを特徴とする神経回路網装置。
  3. 請求項1に記載のニューロン装置N個と、
    前記N個のニューロン装置が、入力信号値の入力を受け付け、出力信号値を出力する時間間隔で、1つまたは複数の非負実数信号値の入力を受け付けて、当該非負実数信号値の総和uを、前記N個のニューロン装置に入力信号値として与える非負実数受付部と、
    前記N個のニューロン装置により出力される出力信号値の総和を、非負整数信号値として出力する非負整数出力部を、
    を備え、
    前記N個のニューロン装置は、当該閾値変数θの初期値としてそれぞれ、1,2,…,Nを当該閾値記憶部に記憶し、前記N個のニューロン装置のそれぞれにおいて、当該閾値係数Δθ1、Δθ2の値として0を当該閾値記憶部に記憶する、
    ことを特徴とする非負整数符号化装置。
  4. 請求項3に記載の非負整数符号化装置2個(以下、一方を「正側符号化装置」、他方を「負側符号化装置」という。)と、
    前記2個の非負整数符号化装置が、非負実数信号値の入力を受け付け、非負整数信号値を出力する時間間隔で、1つまたは複数の実数信号値の入力を受け付けて、当該実数信号値の総和vが、
    (a)非負であれば、実数値vを、前記正側符号化装置に非負実数信号値として与え、0を、前記負側符号化装置に非負実数信号値として与え、
    (b)負であれば、0を、前記正側符号化装置に非負実数信号値として与え、実数値-vを、前記負側符号化装置に非負実数信号値として与える
    実数受付部と、
    前記正側符号化装置から出力される非負整数信号値を入力として与えられ、当該非負整数に対する演算を行う正側神経回路網と、
    前記負側符号化装置から出力される非負整数信号値を入力として与えられ、前記正側神経回路網と同一の回路構成を有する負側神経回路網と、
    前記正側神経回路網より出力される信号値から、前記負側神経回路網より出力される信号値を減算した値を整数演算結果信号として出力する整数演算出力部
    を備えることを特徴とする整数クラスタ装置。
  5. 制御対象の変位の目標値と、当該変位の観測値および当該変位の微分の観測値と、の入力を受け付ける制御入力受付部と、
    正側フィードバック装置と、
    負側フィードバック装置と、
    を備えるフィードバック制御装置であって、
    当該正側フィードバック装置と、当該負側フィードバック装置と、は、いずれも、
    (a)請求項3に記載の非負整数符号化装置A1と、
    (b)請求項3に記載の非負整数符号化装置A2と、
    (c)請求項3に記載の非負整数符号化装置A3と、
    (d)重みp,k1,k2,v1,v2と、重み係数Δq1,Δq2と、を記憶する制御記憶部、
    (e)前記非負整数符号化装置A1から出力される非負整数信号値uに前記記憶される重みpを乗じた信号値p uが、実数信号値の入力として与えられる請求項3に記載の非負整数符号化装置B1と、
    (f)前記非負整数符号化装置A1から出力される非負整数信号値に前記記憶される重みk1を乗じた信号値と、前記非負整数符号化装置A2から出力される非負整数信号値に前記記憶される重みk2を乗じた信号値と、が、実数信号値の入力として与えられる請求項3に記載の非負整数符号化装置B2と、
    (g)前記非負整数符号化装置B1から出力される非負整数信号値に前記記憶される重みv1を乗じた信号値と、前記非負整数符号化装置B2から出力される非負整数信号値に前記記憶される重みv2を乗じた信号値と、が、実数信号値の入力として与えられる請求項3に記載の非負整数符号化装置Cと、
    (h)前記非負整数符号化装置Cから出力される非負整数信号値xを、操作値として出力する片側操作出力部と、
    (j)前記非負整数符号化装置A1から出力される非負整数信号値uと、前記非負整数符号化装置Cから出力される非負整数信号値xと、から、
    Δq1 x2 u + Δq2(x2 u - 1)
    を計算し、前記制御記憶部に記憶される重みpを、その計算結果だけ増加するように更新する制御更新部と、
    を備え、
    前記制御入力受付部は、
    (1)制御対象の変位の目標値が非負であれば、当該正側フィードバック装置の非負整数符号化装置A1に当該値を実数信号値の入力として与え、当該負側フィードバック装置の非負整数符号化装置A1に0を実数信号値の入力として与え、
    (2)制御対象の変位の目標値が負であれば、当該正側フィードバック装置の非負整数符号化装置A1に0を実数信号値の入力として与え、当該負側フィードバック装置の非負整数符号化装置A1に当該値を実数信号値の入力として与え、
    (3)制御対象の変位の観測値が非負であれば、当該正側フィードバック装置の非負整数符号化装置A2に当該値を実数信号値の入力として与え、当該負側フィードバック装置の非負整数符号化装置A2に0を実数信号値の入力として与え、
    (4)制御対象の変位の観測値が負であれば、当該正側フィードバック装置の非負整数符号化装置A2に0を実数信号値の入力として与え、当該負側フィードバック装置の非負整数符号化装置A2に当該値を実数信号値の入力として与え、
    (5)制御対象の変位の微分の観測値が非負であれば、当該正側フィードバック装置の非負整数符号化装置A3に当該値を実数信号値の入力として与え、当該負側フィードバック装置の非負整数符号化装置A3に0を実数信号値の入力として与え、
    (6)制御対象の変位の微分の観測値が負であれば、当該正側フィードバック装置の非負整数符号化装置A3に0を実数信号値の入力として与え、当該負側フィードバック装置の非負整数符号化装置A3に当該値を実数信号値の入力として与え、
    前記フィードバック制御装置は、
    当該正側フィードバック装置より出力される操作値から、当該負側フィードバック装置より出力される操作値を減算した値を、操作出力として制御対象に与える操作出力部
    をさらに備えることを特徴とするフィードバック制御装置。
  6. 請求項5に記載のフィードバック制御装置であって、
    前記非負整数符号化装置B1,B2,Cのそれぞれにおいて、当該2つの閾値係数Δθ1、Δθ2として、0を記憶するのにかえて、
    Δθ1 > 0 > Δθ2
    なる関係を満たす定数値を記憶する
    ことを特徴とするフィードバック制御装置。
  7. 請求項5または6に記載のフィードバック制御装置であって、
    当該観測対象は、K種類の目標状態を有し、当該K種類の目標状態のそれぞれには、目標値が対応付けられ、
    前記フィードバック制御装置は、請求項1に記載のニューロン装置K個をさらに備え、
    前記K個のニューロン装置と、前記正側フィードバック装置および前記負側フィードバック装置との組み合わせにおいて、観測対象の目標状態がi番目の目標状態である場合に、i番目のニューロン装置には正の入力信号値が与えられ、それ以外のニューロン装置には0の入力信号値が与えられ、
    前記フィードバック制御装置は、前記K個のニューロン装置のそれぞれに対して、
    (1)当該ニューロン装置に対する切替重みr1,r2,r3,r4と、切替重み係数Δs1,Δs2と、を記憶する切替重み記憶部と、
    (2)当該ニューロン装置から出力される出力信号値yに前記記憶される重みr1を乗じた信号値が、実数信号値の入力として与えられる請求項3に記載の非負整数符号化装置D1と、
    (3)当該ニューロン装置から出力される出力信号値yに前記記憶される重みr2を乗じた信号値が、実数信号値の入力として与えられる請求項3に記載の非負整数符号化装置D2と、を有し、
    (4)当該非負整数符号化装置D1から出力される非負整数信号値に前記記憶される重みr3を乗じた信号値と、当該非負整数符号化装置D2から出力される非負整数信号値に前記記憶される重みr4を乗じた信号値と、は、前記非負整数符号化装置Cに、さらに実数信号値の入力として与えられ、
    (5)当該ニューロン装置から出力される出力信号値yと、前記非負整数符号化装置Cから出力される非負整数信号値xと、から、
    Δs1 x2 y + Δs2(x2 y - 1)
    を計算し、前記制御記憶部に記憶される重みr1を、その計算結果だけ増加するように更新する切り替え制御更新部をさらに有する
    ことを特徴とするフィードバック制御装置。
  8. 請求項7に記載のフィードバック制御装置であって、
    前記非負整数符号化装置D1,D2のそれぞれにおいて、当該2つの閾値係数Δθ1、Δθ2として、0を記憶するのにかえて、
    Δθ1 > 0 > Δθ2、かつ、
    |Δθ1| > |Δθ2|
    なる関係を満たす定数値を記憶する
    ことを特徴とするフィードバック制御装置。
  9. コンピュータを、請求項1に記載のニューロン装置が備える各部として機能させることを特徴とするプログラム。
  10. コンピュータを、請求項2に記載の神経回路網装置が備える各部として機能させることを特徴とするプログラム。
  11. コンピュータを、請求項3に非負整数符号化装置が備える各部として機能させることを特徴とするプログラム。
  12. コンピュータを、請求項4に記載の整数クラスタ装置が備える各部として機能させることを特徴とするプログラム。
  13. コンピュータを、請求項5から8のいずれか1項に記載のフィードバック制御装置が備える各部として機能させることを特徴とするプログラム。
JP2007257123A 2007-10-01 2007-10-01 ニューロン装置、神経回路網装置、非負整数符号化装置、整数クラスタ装置、フィードバック制御装置、ならびに、プログラム Expired - Fee Related JP5115965B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2007257123A JP5115965B2 (ja) 2007-10-01 2007-10-01 ニューロン装置、神経回路網装置、非負整数符号化装置、整数クラスタ装置、フィードバック制御装置、ならびに、プログラム
CN2008801089833A CN101809598B (zh) 2007-10-01 2008-09-30 神经元装置、神经网络装置、反馈控制装置及信息存储介质
PCT/JP2008/067774 WO2009044751A1 (ja) 2007-10-01 2008-09-30 ニューロン装置、神経回路網装置、フィードバック制御装置、ならびに、情報記録媒体
US12/680,678 US8620844B2 (en) 2007-10-01 2008-09-30 Neuron device for simulating a nerve cell and neural network device, integer cluster device, feedback control device, and computer program product thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007257123A JP5115965B2 (ja) 2007-10-01 2007-10-01 ニューロン装置、神経回路網装置、非負整数符号化装置、整数クラスタ装置、フィードバック制御装置、ならびに、プログラム

Publications (2)

Publication Number Publication Date
JP2009087114A JP2009087114A (ja) 2009-04-23
JP5115965B2 true JP5115965B2 (ja) 2013-01-09

Family

ID=40526178

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007257123A Expired - Fee Related JP5115965B2 (ja) 2007-10-01 2007-10-01 ニューロン装置、神経回路網装置、非負整数符号化装置、整数クラスタ装置、フィードバック制御装置、ならびに、プログラム

Country Status (4)

Country Link
US (1) US8620844B2 (ja)
JP (1) JP5115965B2 (ja)
CN (1) CN101809598B (ja)
WO (1) WO2009044751A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102168003B1 (ko) 2016-05-20 2020-10-20 구글 엘엘씨 오브젝트(들)를 캡처하는 이미지(들)에 기초하는 그리고 환경에서의 미래 로봇 움직임에 대한 파라미터(들)에 기초하여 로봇 환경에서의 오브젝트(들)의 모션(들)을 예측하는 것과 관련된 머신 학습 방법들 및 장치
CN114967433B (zh) * 2016-05-20 2023-08-18 谷歌有限责任公司 基于捕获物体的图像的机器学习方法和装置
CN111126590B (zh) * 2016-12-23 2023-09-29 中科寒武纪科技股份有限公司 一种人工神经网络运算的装置及方法
CN107578097A (zh) * 2017-09-25 2018-01-12 胡明建 一种多阀值多函数反馈人工神经元的设计方法
EP3796189A4 (en) 2018-05-18 2022-03-02 Cambricon Technologies Corporation Limited VIDEO RECOVERY METHOD, AND METHOD AND APPARATUS FOR GENERATING A VIDEO RECOVERY MAPPING RELATION
CN110147873B (zh) * 2018-05-18 2020-02-18 中科寒武纪科技股份有限公司 卷积神经网络的处理器及训练方法
US11010132B2 (en) * 2018-09-28 2021-05-18 Tenstorrent Inc. Processing core with data associative adaptive rounding
CN111880406B (zh) * 2020-07-14 2022-04-15 金陵科技学院 基于Hebb学习的自适应预测控制主队列管理方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4975961A (en) * 1987-10-28 1990-12-04 Nec Corporation Multi-layer neural network to which dynamic programming techniques are applicable
US4874963A (en) * 1988-02-11 1989-10-17 Bell Communications Research, Inc. Neuromorphic learning networks
JPH05234009A (ja) * 1992-02-21 1993-09-10 Nec Corp サグ補償回路
US5446829A (en) * 1993-06-24 1995-08-29 The United States Of America As Represented By The Department Of Health And Human Services Artificial network for temporal sequence processing
JPH07141313A (ja) * 1993-11-18 1995-06-02 Fujitsu Ltd 神経回路素子
JPH07319507A (ja) * 1994-05-26 1995-12-08 Bridgestone Corp ロボット制御装置
JPH08249297A (ja) * 1995-03-15 1996-09-27 Toshiba Corp ニューラルネットワーク装置
JP3584669B2 (ja) * 1997-04-01 2004-11-04 トヨタ自動車株式会社 電気自動車用駆動制御装置
JPWO2004104917A1 (ja) * 2003-05-20 2006-07-20 富士通株式会社 センサおよびセンサプログラム

Also Published As

Publication number Publication date
US20100217733A1 (en) 2010-08-26
CN101809598A (zh) 2010-08-18
WO2009044751A1 (ja) 2009-04-09
US8620844B2 (en) 2013-12-31
JP2009087114A (ja) 2009-04-23
CN101809598B (zh) 2013-06-19

Similar Documents

Publication Publication Date Title
JP5115965B2 (ja) ニューロン装置、神経回路網装置、非負整数符号化装置、整数クラスタ装置、フィードバック制御装置、ならびに、プログラム
CN107160398B (zh) 基于确定学习的全状态受限刚性机械臂安全可靠控制方法
Song et al. Robust backpropagation training algorithm for multilayered neural tracking controller
Teng et al. An error-state model predictive control on connected matrix Lie groups for legged robot control
US6000827A (en) System identifying device and adaptive learning control device
Yen Reconfigurable learning control in large space structures
Feng et al. Variable admittance interaction control of UAVs via deep reinforcement learning
CN113043266A (zh) 一种基于迭代学习的自适应力跟踪控制方法
JP7438610B2 (ja) クロスバー・アレイ構造を有するニューロモルフィック・デバイス
Macnab et al. CMAC adaptive control of flexible-joint robots using backstepping with tuning functions
Cheng et al. Application of GA-based neural network for attitude control of a satellite
Abdulla et al. Roll control system design using auto tuning LQR technique
Jung et al. Reference compensation technique of neural force tracking impedance control for robot manipulators
Baghli et al. Design and simulation of Adaptive Neuro Fuzzy Inference System (ANFIS) controller for a robot manipulator
Fradkov et al. Adaptive control design and experiments for laas “helicopter” benchmark
JP2008225607A (ja) 制御装置、制御システム、ならびに、プログラム
Ivancevic et al. Brain-like functor control machine for general humanoid biodynamics
CN112953458A (zh) 一种基于忆阻的二阶阻尼情感电路
CN115016273A (zh) 一种单连杆机械手臂的预定义时间稳定控制方法及系统
Ismail et al. The application of IWO in LQR controller design for the Robogymnast
Lechuga-Gutiérrez et al. Quaternion spiking neural networks control for robotics
Lee et al. Multiple neuro-adaptive control of robot manipulators using visual cues
US20210142153A1 (en) Resistive processing unit scalable execution
Rivolta et al. Centralized/decentralized indirect robust adaptive control for spacecraft attitude and robotics
Tascillo et al. Neural and fuzzy robotic hand control

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100927

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100927

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120918

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121010

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151026

Year of fee payment: 3

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees