JP2020121376A - Control device, control system and control program - Google Patents

Control device, control system and control program Download PDF

Info

Publication number
JP2020121376A
JP2020121376A JP2019014886A JP2019014886A JP2020121376A JP 2020121376 A JP2020121376 A JP 2020121376A JP 2019014886 A JP2019014886 A JP 2019014886A JP 2019014886 A JP2019014886 A JP 2019014886A JP 2020121376 A JP2020121376 A JP 2020121376A
Authority
JP
Japan
Prior art keywords
control
control device
generation unit
signal
spike
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019014886A
Other languages
Japanese (ja)
Other versions
JP7421719B2 (en
Inventor
将吾 米倉
Shogo Yonekura
将吾 米倉
康夫 國吉
Yasuo Kuniyoshi
康夫 國吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
University of Tokyo NUC
Original Assignee
National Institute of Advanced Industrial Science and Technology AIST
University of Tokyo NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Advanced Industrial Science and Technology AIST, University of Tokyo NUC filed Critical National Institute of Advanced Industrial Science and Technology AIST
Priority to JP2019014886A priority Critical patent/JP7421719B2/en
Priority to PCT/JP2020/001427 priority patent/WO2020158439A1/en
Publication of JP2020121376A publication Critical patent/JP2020121376A/en
Application granted granted Critical
Publication of JP7421719B2 publication Critical patent/JP7421719B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J13/00Controls for manipulators
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Automation & Control Theory (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Feedback Control In General (AREA)
  • Manipulator (AREA)

Abstract

To provide a control device which autonomously reacts even if an unintentional change of an external environment occurs, and makes a control object stably perform a desired operation, a control system and a control program.SOLUTION: This control device can control a control object by supplying a drive signal to the control object, and comprises a spike signal row creation part and a drive signal creation part. The spike signal row creation part can create an internal state including a fundamental control signal for controlling the control object and a disturbance, and a spike signal row at timing which is defined by dynamics related to the internal state. The drive signal creation part can create the drive signal which is continuously changed in a time series on the basis of the spike signal row.SELECTED DRAWING: Figure 1

Description

本発明は、産業用と医療用および家庭用などのロボットや移動システムの運動・制御、製造プラントなど、複雑で動的な状態変化を伴うシステムにおける制御装置、制御システム、および制御プログラムに関する。 The present invention relates to a control device, a control system, and a control program in a system involving complicated and dynamic state changes such as motion/control of robots and moving systems for industrial use, medical use, and home use, a manufacturing plant, and the like.

工業、商業、農業などの産業界、手術や看護・介護などの医療界、さらには清掃など家庭におけるロボットや産業機械の複雑化・高機能化が急激に進んでいる。これら、ロボットや産業機械などの装置の構成要素は一様で無く、また作業対象や動作環境は必ずしも一定では無い。 Industrial and commercial industries such as agriculture, medical fields such as surgery and nursing/nursing care, and households such as cleaning robots and industrial machines are becoming more complex and highly functional. The components of these devices such as robots and industrial machines are not uniform, and the work target and operating environment are not always constant.

その様な中でニューロンネットワーク(ニューラルネットワーク)を適用した装置に繰り返し学習を行なうことで、個体毎の運動パターンを生成する二足歩行ロボットとして、特許文献1が提案されている。特許文献1では請求項1に記載の通り、ニューロンネットワークを備えており、図3や[0004]に記載の通り、繰り返し学習により設計精度の向上や設計時間の短縮を図っている。 Patent Document 1 is proposed as a bipedal walking robot that generates a motion pattern for each individual by repeatedly performing learning in a device to which a neuron network (neural network) is applied. In Patent Document 1, a neuron network is provided as described in claim 1, and as described in FIG. 3 and [0004], it is attempted to improve design accuracy and shorten design time by iterative learning.

特開2006−88331号公報JP, 2006-88331, A

特許文献1で利用されているニューロンネットワークは図11や段落[0007]〜[0008]に記載されている通り、複数の入力に対して一意の重み付け係数W_k_*をかけて出力信号を生成している。この重み付け係数W_k_*を繰り返し学習によって最適化しているものである。そのため、装置個体の構成が固定され、さらに環境が一定の条件下では最適化が可能であるが、外乱などによる予期しない環境の変化には追随出来ない。 The neuron network used in Patent Document 1 generates an output signal by applying a unique weighting coefficient W_k_* to a plurality of inputs, as described in FIG. 11 and paragraphs [0007] to [0008]. There is. This weighting coefficient W_k_* is optimized by iterative learning. Therefore, although the configuration of each device is fixed and the environment can be optimized under a constant environment, it cannot follow an unexpected change in the environment due to disturbance or the like.

本発明は、かかる事情を鑑みてなされたものであり、予期しない外的環境の変化が発生しても、自律的に反応し、制御対象が所望の動作を安定的に行なうことを可能とする制御装置、制御システム、および制御プログラムを提供することを目的とする。 The present invention has been made in view of such circumstances, and makes it possible for a controlled object to stably perform a desired operation by reacting autonomously even when an unexpected external environment change occurs. An object is to provide a control device, a control system, and a control program.

本発明によれば、制御装置であって、駆動信号を制御対象に供給することで前記制御対象を制御可能に構成されるもので、スパイク信号列生成部と駆動信号生成部とを備え、前記スパイク信号列生成部は、前記制御対象を制御するための基本制御信号と擾乱を含む内部状態、および内部状態に関するダイナミクスによって規定されるタイミングで、スパイク信号列を生成可能に構成され、前記駆動信号生成部は、前記スパイク信号列に基づいて時系列に連続変化する前記駆動信号を生成可能に構成される、制御装置が提供される。 According to the present invention, the control device is configured to control the control target by supplying a drive signal to the control target, and includes a spike signal train generation unit and a drive signal generation unit, The spike signal train generation unit is configured to be able to generate a spike signal train at an internal state including a basic control signal and a disturbance for controlling the controlled object, and at a timing defined by dynamics related to the internal state, and the drive signal A control device is provided in which the generation unit is configured to be capable of generating the drive signal that continuously changes in time series based on the spike signal train.

本発明に係る制御装置では、基本制御信号を、前記スパイク信号列生成部により一旦スパイク信号列に変換したのちに、前記駆動信号生成部にて生成した駆動信号を用いて制御対象に対する制御を行なう。このとき、予期しない外的環境の変化が発生しても、制御装置側が自律的に反応し、制御システム全体が所望の動作を行なうことが可能となるという有利な効果を奏する。 In the control device according to the present invention, the basic control signal is once converted into the spike signal train by the spike signal train generation unit, and then the control target is controlled using the drive signal generated by the drive signal generation unit. .. At this time, even if an unexpected change in the external environment occurs, the control device side reacts autonomously, and the entire control system can perform a desired operation, which is an advantageous effect.

本発明の実施形態に係る制御装置および制御対象からなる制御システムの機能ブロック図。1 is a functional block diagram of a control system including a control device and a control target according to an embodiment of the present invention. 制御装置における最適化制御フロー図。The optimization control flow chart in a control apparatus. スパイク信号列を用いた制御例として水平軸上の粒子位置を制御する構成図。The block diagram which controls the particle position on a horizontal axis as a control example using a spike signal train. 水平軸上を移動する粒子に関する3重/2重/1重井戸ポテンシャルを示す状態図。FIG. 3 is a state diagram showing a triple/double/single well potential for particles moving on a horizontal axis. 秩序創発機能のうち、エントロピー減少・パターン形成機能に関するシミュレーション結果図。Of the order emergence function, the simulation result diagram regarding the entropy reduction/pattern formation function. 秩序創発機能のうち、目標状態への引き込み領域拡大機能に関するシミュレーション結果図。Of the order emergence function, the simulation result diagram regarding the function of expanding the pull-in area to the target state. 秩序創発機能のうち、自然周波数へのバインディング機能に関するシミュレーション結果図。Of the order emergence function, the simulation result diagram regarding the binding function to the natural frequency. 制御システムの一例である筋骨格ロボット制御システムの構成図。The block diagram of the musculoskeletal robot control system which is an example of a control system. 筋骨格ロボット制御システムの低摩擦環境における移動速度シミュレーション結果図。FIG. 6 is a diagram showing a moving speed simulation result of a musculoskeletal robot control system in a low friction environment. 筋骨格ロボット制御システムの低摩擦環境における協調運動能力シミュレーション結果図。FIG. 6 is a diagram showing a result of a simulation of a cooperative movement ability of a musculoskeletal robot control system in a low friction environment. スパイク信号列生成部と駆動信号生成部を外付け制御装置とした制御システムの機能ブロック図。FIG. 3 is a functional block diagram of a control system in which the spike signal train generation unit and the drive signal generation unit are external control devices.

以下、図面を用いて本発明の実施形態について説明する。以下に示す実施形態中で示した各種特徴事項は、互いに組み合わせ可能である。特に、本明細書において「部」とは、例えば、広義の回路によって実施されるハードウェア資源と、これらのハードウェア資源によって具体的に実現されうるソフトウェアの情報処理とを合わせたものも含みうる。また、本実施形態においては様々な情報を取り扱うが、これら情報は、0または1で構成される2進数のビット集合体として信号値の高低によって表されるデジタル信号情報と、電圧・電流が連続的に変化するアナログ信号情報、および時間軸上で瞬間的に電圧・電流が発生するスパイク信号情報で、広義の回路上で通信・演算が実行されうる。 Embodiments of the present invention will be described below with reference to the drawings. The various features shown in the embodiments described below can be combined with each other. In particular, in the present specification, the “unit” may include, for example, a combination of hardware resources implemented by a circuit in a broad sense and information processing of software that can be specifically realized by these hardware resources. .. In addition, although various kinds of information are handled in the present embodiment, these pieces of information are digital signal information represented by high and low of a signal value as a binary bit aggregate composed of 0 or 1, and voltage and current are continuous. Communication and calculation can be performed on a circuit in a broad sense by analog signal information that changes dynamically and spike signal information that instantaneously generates voltage and current on the time axis.

また、広義の回路とは、デジタル回路(Digital Circuit)、アナログ回路(Analog Circuit)、光回路(Optical Circuit)、回路類(Circuitry)、プロセッサ(Processor)、およびメモリ(Memory)等を少なくとも適当に組み合わせることによって実現される回路である。すなわち、デジタル回路としては、特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)、プログラマブル論理デバイス(例えば、単純プログラマブル論理デバイス(Simple Programmable Logic Device:SPLD)、複合プログラマブル論理デバイス(Complex Programmable Logic Device:CPLD)、およびフィールドプログラマブルゲートアレイ(Field Programmable Gate Array:FPGA))等を含むものである。アナログ回路としては、抵抗、コンデンサ(Capasitor)、インダクタ(Inductor)などの受動素子(Passive Component)、ダイオード(Diode)、トランジスタ(Transistor)、サイリスタ(Thyristor)などのディスクリート半導体(Discrete Semiconductor)、およびコンパレータ(Comparator)などのアナログ集積回路(Analog Integrated Circuit)等を含むものである。また、デジタル回路とアナログ回路の境界部に、D/Aコンバータ(Digital−to−Analog Converter)もしくはA/Dコンバータ(Analog−to−Digital Converter)を使用する回路構成も可能である。さらに光回路としては、発光ダイオード(Light Emitting Diode)、半導体レーザー(Semiconductor Laser)などの発光素子(Light Emitter)、フォトダイオード(Photodiode)などの受光素子(Photodetector)、光ファイバー(Optiocal Fiber)などの光導波路(Optical Waveguide)さらには光集積回路(Optical Integrated Circuit)等を含むものである。 Further, the circuit in a broad sense at least appropriately includes a digital circuit (Digital Circuit), an analog circuit (Analog Circuit), an optical circuit (Optical Circuit), circuits (Circuitry), a processor (Processor), a memory (Memory) and the like. It is a circuit realized by combining them. That is, as a digital circuit, an application specific integrated circuit (ASIC), a programmable logic device (for example, a simple programmable logic device (Simple Programmable Logic Device: SPLD), a complex programmable logic device (Complex Logic Program)). CPLD), a field programmable gate array (Field Programmable Gate Array: FPGA), and the like. Examples of the analog circuit include resistors, capacitors (capacitors), passive elements (passive components) such as inductors, diodes (diodes), transistors (discrete semiconductors) such as thyristors (discrete semiconductors), and comparators. (Comparator) and other analog integrated circuits (Analog Integrated Circuit) and the like. A circuit configuration using a D/A converter (Digital-to-Analog Converter) or an A/D converter (Analog-to-Digital Converter) is also possible at the boundary between the digital circuit and the analog circuit. Further, as an optical circuit, a light emitting diode (Light Emitting Diode), a light emitting element (Light Emitter) such as a semiconductor laser (Semiconductor Laser), a light receiving element (Photodetector) such as a photodiode (Photodiode), and an optical fiber (Optical Optical) such as an optical fiber. It includes a waveguide (Optical Waveguide), an optical integrated circuit (Optical Integrated Circuit), and the like.

1.全体構成
第1節では、本発明に係る制御装置を含む制御システム1の全体構成について図面を用いて説明する。図1は、本実施形態に係る制御システム1の構成概要を示す図である。制御システム1は、制御装置2および制御対象3とを備え、これらが電気的に接続されたシステムである。制御対象3は二脚歩行などのロボット(後述)、移動体、ペースメーカー、電気回路系、化学反応系、通信ネットワーク、社会経済管理システム、金融システム、生体ネットワークおよび動植物など、運動・状態に関して周辺環境変化により、電気的、力学的もしくは化学的内部状態などが変動する特性を持ち、所望である動作を行なうために制御を必要とするものである。前記内部状態は、前記制御システム1の機能や動作に関わり、かつ検知可能なものであれば項目は限定されない。
1. Overall Configuration In Section 1, the overall configuration of a control system 1 including a control device according to the present invention will be described with reference to the drawings. FIG. 1 is a diagram showing a schematic configuration of a control system 1 according to the present embodiment. The control system 1 is a system that includes a control device 2 and a controlled object 3 and that are electrically connected to each other. The controlled object 3 is a robot such as a bipedal locomotive (described later), a moving body, a pacemaker, an electric circuit system, a chemical reaction system, a communication network, a socioeconomic management system, a financial system, a biological network, an animal and plant environment, and the surrounding environment with respect to movement and condition It has a characteristic that the electrical, mechanical or chemical internal state changes due to the change, and requires control in order to perform a desired operation. Items are not limited as long as the internal state is related to the function or operation of the control system 1 and can be detected.

1.1 制御装置2
図1に示す通り、制御装置2は通信部21と、記憶部22と、制御部23とを有し、これらの構成要素が制御装置2内部において通信バス20を電気的に接続されている。以下、各構成要素についてさらに説明する。
1.1 Control device 2
As shown in FIG. 1, the control device 2 has a communication unit 21, a storage unit 22, and a control unit 23, and these components are electrically connected to the communication bus 20 inside the control device 2. Hereinafter, each component will be further described.

<通信部21>
通信部21は、制御対象3との間で情報の授受を行なうものである。USB、IEEE1394、Thunderbolt、有線LANネットワーク通信等といった有線型の通信手段が好ましいものの、無線LANネットワーク通信、5G/LTE/3G等のモバイル通信、Bluetooth(登録商標)通信等を必要に応じて含めてもよい。これらは一例であり、専用の通信規格を採用してもよい。すなわち、これら複数の通信手段の集合として実施することがより好ましい。
<Communication unit 21>
The communication unit 21 exchanges information with the controlled object 3. Wired communication means such as USB, IEEE 1394, Thunderbolt, and wired LAN network communication are preferable, but wireless LAN network communication, mobile communication such as 5G/LTE/3G, and Bluetooth (registered trademark) communication are included as necessary. Good. These are examples, and a dedicated communication standard may be adopted. That is, it is more preferable to implement it as a set of a plurality of these communication means.

図1においては、通信部21から制御対象3内の状態検知部31および駆動部30それぞれ別に接続している様子を示しているが、物理的な接続はまとめて1つとし、制御対象3内部で論理的に分配する構成としても良い。 Although FIG. 1 shows a state in which the communication unit 21 is separately connected to the state detection unit 31 and the drive unit 30 in the controlled object 3, the physical connection is one and the inside of the controlled object 3 is shown. May be logically distributed in.

<記憶部22>
記憶部22は、様々な情報を記憶する揮発性または不揮発性の記憶媒体である。これは、例えばソリッドステートドライブ(Solid State Drive:SSD)等のストレージデバイスとして、あるいは、プログラムの演算に係る一時的に必要な情報(引数、配列等)を記憶するランダムアクセスメモリ(Random Access Memory:RAM)等のメモリとして実施されうる。また、これらの組合せであってもよい。
<Memory unit 22>
The storage unit 22 is a volatile or non-volatile storage medium that stores various information. This is, for example, as a storage device such as a solid state drive (SSD), or a random access memory (Random Access Memory) for storing temporarily necessary information (arguments, arrays, etc.) related to the calculation of a program. It may be implemented as a memory such as RAM). Also, a combination of these may be used.

特に、記憶部22は、制御実行内容に関する各種パラメータ、制御対象3に関する形状、寸法、材質、重量などの個別特徴情報、最適化途中を含む連続制御時における過去の設定情報を記憶している。 In particular, the storage unit 22 stores various parameters related to control execution contents, individual characteristic information such as shape, size, material, and weight related to the controlled object 3, and past setting information at the time of continuous control including in the middle of optimization.

また、記憶部22は、制御部23によって実行される制御装置2に係る種々のプログラム等を記憶している。具体的には例えば、二脚歩行ロボットの様に複数の筋・腱および関節など複数の駆動要素を有する制御対象3に関する動作手順や、制御部23を構成する基本制御信号生成部231、スパイク信号列生成部232、駆動信号生成部233で用いるパラメータ群の初期値や更新手順である。 Further, the storage unit 22 stores various programs and the like related to the control device 2 executed by the control unit 23. Specifically, for example, an operation procedure regarding the controlled object 3 having a plurality of driving elements such as a plurality of muscles/tendons and joints like a bipedal walking robot, a basic control signal generation unit 231, a spike signal that constitutes the control unit 23, and the like. These are initial values and update procedures of parameter groups used in the column generation unit 232 and the drive signal generation unit 233.

<制御部23>
制御部23は、制御装置2に関連する全体動作の処理・制御を行なう。制御部23は、例えば不図示の中央処理装置(Central Processing Unit:CPU)である。制御部23は、記憶部22に記憶された所定のプログラムを読み出すことによって、制御装置2に係る種々の機能を実現する。具体的には制御対象3毎に予め与えられた情報、制御対象3内状態検知部31から通信部21を介して受信した状態情報を元に、基本制御信号生成部231とスパイク信号列生成部232と駆動信号生成部233を通じて制御対象3への駆動信号ASを生成し制御を実施する機能が該当する。
<Control unit 23>
The control unit 23 processes and controls the overall operation related to the control device 2. The control unit 23 is, for example, a central processing unit (CPU) (not shown). The control unit 23 realizes various functions of the control device 2 by reading out a predetermined program stored in the storage unit 22. Specifically, based on the information given in advance for each controlled object 3 and the state information received from the controlled object 3 internal state detection unit 31 via the communication unit 21, the basic control signal generation unit 231 and the spike signal sequence generation unit. The function of generating the drive signal AS to the controlled object 3 through the drive signal generating unit 232 and the drive signal generating unit 233 and executing the control is applicable.

すなわち、ソフトウェア(記憶部22に記憶されている)による情報処理がハードウェア(制御部23)によって具体的に実現されることで、基本制御信号生成部231、スパイク信号列生成部232、および駆動信号生成部233として実行されうる。なお、図1においては、単一の制御部23として表記されているが、実際の構成はこれに限るものではなく、機能毎に複数の制御部23を有するように実施してもよい。また、それらの組合せであっても良い。以下、基本制御信号生成部231、スパイク信号列生成部232、駆動信号生成部233についてさらに詳述する。 That is, the information processing by the software (stored in the storage unit 22) is specifically realized by the hardware (control unit 23), so that the basic control signal generation unit 231, the spike signal sequence generation unit 232, and the drive. It may be executed as the signal generator 233. In addition, in FIG. 1, it is described as a single control unit 23, but the actual configuration is not limited to this, and a plurality of control units 23 may be provided for each function. Also, a combination thereof may be used. Hereinafter, the basic control signal generator 231, the spike signal string generator 232, and the drive signal generator 233 will be described in more detail.

[基本制御信号生成部231]
基本制御信号生成部231はソフトウェア(記憶部22に記憶されている)による情報処理がハードウェア(制御部23)によって具体的に実現されているものである。基本制御信号生成部231は、通信部21を介して制御対象3の状態検知部31から得た状態情報、および制御対象3毎に予め与えられたパラメータを元に、非スパイク信号状である基本制御信号CSを生成するものである。制御アルゴリズムは限定されるものではなく、フィードバック制御、フィードフォワード制御、モデル予測制御、深層学習を用いた制御など各種アルゴリズムが利用可能である。
[Basic control signal generation unit 231]
The basic control signal generation unit 231 is one in which information processing by software (stored in the storage unit 22) is specifically realized by hardware (control unit 23). The basic control signal generation unit 231 is a non-spike signal based on the state information obtained from the state detection unit 31 of the controlled object 3 via the communication unit 21 and the parameters given in advance for each controlled object 3. The control signal CS is generated. The control algorithm is not limited, and various algorithms such as feedback control, feedforward control, model predictive control, and control using deep learning can be used.

なお、後述する秩序創発機能を最大限利用するには、基本制御信号生成部231単体の周波数特性として、強い自然周波数/固有周波数ピークを持たない制御アルゴリズムとパラメータ設定が望ましい。 In order to maximize the use of the ordered emergence function, which will be described later, it is desirable that the basic control signal generation unit 231 has a frequency characteristic of a control algorithm and parameter setting that does not have a strong natural frequency/natural frequency peak.

[スパイク信号列生成部232]
スパイク信号列生成部232は、ソフトウェア(記憶部22に記憶されている)による情報処理がハードウェア(制御部23)によって具体的に実現されているもので、ハードウェアは前述したデジタル回路およびアナログ回路の組合せで構成される。
[Spike signal sequence generation unit 232]
The spike signal sequence generation unit 232 is one in which information processing by software (stored in the storage unit 22) is specifically realized by hardware (control unit 23), and the hardware is the digital circuit and analog described above. Composed of a combination of circuits.

スパイク信号列生成部232は、基本制御信号生成部231で生成された基本制御信号CSを入力とし、スパイク信号列STを生成する要素であるニューロン(図1中不図示)を内包するものである。このスパイク信号列生成部232は、生体において確率的にインパルス状の活動電位を発生するニューロンネットワークすなわち確率的スパイキングニューロンネットワーク(Stochsastically Spiking Neuron Network:sSNN)と同等の動作をするものである。スパイク信号列生成部232内ニューロンとしては、LIF(leaky integrate−and−fire)ニューロンを始め、ポアソン(Poisson)スパイクモデルやホジキン−ハクスレイ(Hodgkin−Huxley)モデル、バースト発火可能なモデルなど、入力となる基本制御信号と擾乱を含む内部状態、および内部状態に関するダイナミクスによって規定されるタイミングでスパイク信号列を生成するモデルが適用可能である。 The spike signal train generation unit 232 receives the basic control signal CS generated by the basic control signal generation unit 231, and includes a neuron (not shown in FIG. 1) that is an element that generates the spike signal train ST. .. The spike signal sequence generation unit 232 operates similarly to a neuron network that stochastically generates impulse-like action potentials in a living body, that is, a stochastic spiking neuron network (sSNN). As the neurons in the spike signal sequence generation unit 232, there are LIF (leaky integrate-and-fire) neurons, Poisson spike models, Hodgkin-Huxley models, burst ignitable models, and the like. It is possible to apply a model that generates a spike signal train at a timing defined by a basic control signal and an internal state including a disturbance, and dynamics related to the internal state.

スパイク信号列生成部232(sSNN)内に複数のニューロンが存在する場合は、それらニューロン同士の間に任意のシナプス結合を有することも可能である。その際、全てのニューロンは同期発火しない様に設計される。具体的には、例えばニューロン毎に独立のノイズを受ける、あるいはニューロン毎に異なる発火閾値(後述)やリセット電位(後述)を設定する、などである。 When a plurality of neurons exist in the spike signal sequence generation unit 232 (sSNN), it is possible to have arbitrary synaptic connections between the neurons. At that time, all neurons are designed not to fire synchronously. Specifically, for example, each neuron receives an independent noise, or a different firing threshold (described later) or reset potential (described later) is set for each neuron.

ここでは、LIFニューロンの場合に関して数式を用いてより詳しく説明する。i番目のスパイク信号列生成部232(sSNN)におけるj番目のLIFニューロンは、下に記述する[数1][数2][数3]として表すことができる。



ここに、v_ijは電位、変数上のドットは時間微分、γは減衰係数、b_ijはバイアス入力(電流)、Iは入力信号、D_iはi番目のスパイク信号列生成部232におけるノイズ強度、ξ_ijは単位強度のガウシアン(正規分布)ノイズ、v^θは発火閾値、v_ij^Rはリセット電位、τ_refは不能期間、kはスパイク信号発生順番号である。
Here, the case of the LIF neuron will be described in more detail using mathematical expressions. The j-th LIF neuron in the i-th spike signal sequence generation unit 232 (sSNN) can be expressed as [Equation 1] [Equation 2] [Equation 3] described below.



Here, v_ij is the potential, dots on the variables are time-differentiated, γ is the attenuation coefficient, b_ij is the bias input (current), I is the input signal, D_i is the noise intensity in the i-th spike signal train generation unit 232, and ξ_ij is Gaussian (normal distribution) noise of unit intensity, v^θ is a firing threshold, v_ij^R is a reset potential, τ_ref is an impossible period, and k is a spike signal generation sequence number.

対象であるLIFニューロンの内部電位v_ijがv^θに到達すると発火し、数学的にはディラック(Dirac)のデルタ関数δで記述されるスパイク信号を生成すると共に、内部電位はv_ij^Rにリセットされ、τ_refの不能期に入る。[数1]で示したLIFニューロンではガウシアンノイズという形で擾乱を加える事により多数のLIFが同期発火することを防いでいる。[数1]から明らかな通り、ノイズ成分印加以外に発火閾値v^θやリセット電位v_ij^Rを個別に設定することでも同期発火を防ぐことが可能である。個々のLIFニューロンにおけるスパイク信号列σ_ijは形式的に[数4]で記述することが出来る。

この際、i番目のスパイク信号列生成部232に複数のLIFニューロンが存在する場合は、各LIFニューロンから出力される全てのスパイク信号列を活用する。その際にはスパイク信号列の平均を用いる、あるいはLIFニューロン毎に線形の重み付けを行なう方式が適用できる。そうして得られた新たなスパイク信号列をスパイク信号列生成部232の出力であるスパイク信号列STとする。
When the internal potential v_ij of the target LIF neuron reaches v^θ, it fires and mathematically generates a spike signal described by the Dirac delta function δ, and the internal potential is reset to v_ij^R. Then, the τ_ref is disabled. In the LIF neuron shown in [Equation 1], a large number of LIFs are prevented from firing synchronously by adding a disturbance in the form of Gaussian noise. As is clear from [Equation 1], it is possible to prevent the synchronous firing by individually setting the firing threshold v^θ and the reset potential v_ij^R in addition to the noise component application. The spike signal train σ_ij in each LIF neuron can be formally described by [Equation 4].

At this time, if a plurality of LIF neurons are present in the i-th spike signal train generation unit 232, all spike signal trains output from each LIF neuron are utilized. At that time, a method of using the average of the spike signal train or a method of linearly weighting each LIF neuron can be applied. The new spike signal train thus obtained is used as the spike signal train ST which is the output of the spike signal train generator 232.

すなわち、スパイク信号列生成部232は、ニューロンネットワークを構成する複数のニューロンを有し、複数のニューロンそれぞれによって出力される信号に基づいて、スパイク信号列STを生成可能に構成される。 That is, the spike signal string generation unit 232 has a plurality of neurons that form a neuron network, and is configured to be able to generate the spike signal string ST based on the signals output by each of the plurality of neurons.

[駆動信号生成部233]
駆動信号生成部233は、ソフトウェア(記憶部22に記憶されている)による情報処理がハードウェア(制御部23)によって具体的に実現されているもので、ハードウェアは前述したデジタル回路およびアナログ回路の組合せで構成される。
[Drive signal generator 233]
The drive signal generation unit 233 is one in which information processing by software (stored in the storage unit 22) is specifically realized by hardware (control unit 23), and the hardware is the digital circuit and analog circuit described above. It is composed of a combination of.

駆動信号生成部233は前記スパイク信号列生成部232で生成されたスパイク信号列STを制御対象3の駆動部30に供給する駆動信号に変換する機能を有する。この駆動信号は生体ニューロンネットワークにおけるシナプス後電位(postsynaptic potential:PSP)に基づいて生成されるものである。 The drive signal generation unit 233 has a function of converting the spike signal sequence ST generated by the spike signal sequence generation unit 232 into a drive signal to be supplied to the drive unit 30 of the controlled object 3. This drive signal is generated based on the post-synaptic potential (PSP) in the biological neuron network.

スパイク信号列STからシナプス後電位相当である駆動信号ASを生成するにはシナプス類似の方式を用いることが出来る。具体的にはローパスフィルタ、古典的α関数状シナプスモデル、方形波シナプスモデル、ダイナミックシナプスモデルなどである。 A method similar to the synapse can be used to generate the drive signal AS corresponding to the post-synaptic potential from the spike signal train ST. Specifically, it is a low-pass filter, a classical α-functional synapse model, a square wave synapse model, a dynamic synapse model, and the like.

駆動信号生成部233における信号処理方式をローパスフィルタとした場合、出力の基となるシナプス後電位(postsynaptic potential:PSP)y_i、制御対象3駆動部30の活性度A_iは、それぞれ[数5][数6]で記述することが可能である。


ここに、τ_sはシナプス時定数、Nは対象とするi番目のスパイク信号列生成部232内のLIFニューロン数、g_i^Aは増幅ゲインで、A_i^0はオフセットである。
When the signal processing method in the drive signal generation unit 233 is a low-pass filter, the post-synaptic potential (PSP) y_i that is the basis of the output and the activity A_i of the controlled target 3 drive unit 30 are respectively [Equation 5][ Equation 6] can be used.


Here, τ_s is a synapse time constant, N is the number of LIF neurons in the target i-th spike signal sequence generation unit 232, g_i^A is an amplification gain, and A_i^0 is an offset.

なお、図1では駆動信号ASを駆動信号生成部233から駆動部30間の直結線で伝えているが、A/D(Analog−to−Digital)変換を行った後、デジタル信号として通信部21を介して駆動部30に伝達する構成も可能である。 Although the drive signal AS is transmitted from the drive signal generation unit 233 to the drive unit 30 by a direct connection in FIG. 1, after the A/D (Analog-to-Digital) conversion is performed, the communication unit 21 outputs a digital signal. It is also possible to adopt a configuration in which the signal is transmitted to the drive unit 30 via.

1.2 制御対象3
制御対象3は具体的には例えば、機械的なタスクを実行するロボットや移動システムなどである。なお本発明の制御装置2はタスクの技術分野を限定するものでは無く、動的に作用するもので、かつ環境変動に伴う動作状態変化を検出可能なものであれば、電気回路システムや化学反応システムも制御対象3とすることが可能である。
1.2 Control target 3
The controlled object 3 is specifically, for example, a robot or a moving system that executes a mechanical task. Note that the control device 2 of the present invention does not limit the technical field of the task, but can be an electric circuit system or a chemical reaction system as long as it is a dynamically acting one and can detect a change in operating state due to environmental changes. The system can also be the controlled object 3.

[駆動部30]
駆動部30は、タスクを実行する際に、外部からの制御信号に基づき制御対象3を動作させるものである。具体的には例えば、制御対象3がロボットの場合におけるモーター、空圧・油圧などのアクチュエータなどであるが、これらに限定されるものでは無い。
[Drive unit 30]
The drive unit 30 operates the controlled object 3 based on a control signal from the outside when executing a task. Specifically, for example, when the controlled object 3 is a robot, it is a motor, an actuator such as pneumatic/hydraulic, or the like, but is not limited to these.

[状態検知部31]
状態検知部31は、制御対象3が動作時に外乱などによる環境変動があった場合を含めて制御対象3の内部状態を検知するものである。内部状態としては、制御対象3における注目する箇所の位置、速度、加速度、回転、角速度、角加速度、力およびモーメントなどの機械的力学的情報、電圧、電流および抵抗などの電気的情報、音や光の物理的情報、温度、圧力、流速などの流体力学情報、濃度、pH、分子量などの化学的情報等であるが、これらに限定されるものでは無い。検知した内部状態は状態情報として通信部21に対して送信できる構成となっている。すなわち換言すると、状態情報とは、前記制御対象における注目する箇所において、制御対象の挙動および環境変動により変化する内部状態を示す情報である。
[State detection unit 31]
The state detection unit 31 detects the internal state of the controlled object 3 including the case where the controlled object 3 changes in environment due to disturbance during operation. The internal state includes the position of a point of interest in the controlled object 3, velocity, acceleration, rotation, angular velocity, angular acceleration, mechanical mechanical information such as force and moment, electrical information such as voltage, current and resistance, and sound and It is, but not limited to, physical information of light, fluid dynamics information such as temperature, pressure and flow velocity, and chemical information such as concentration, pH and molecular weight. The detected internal state can be transmitted to the communication unit 21 as state information. That is, in other words, the state information is information indicating an internal state that changes due to the behavior of the control target and environmental changes at the point of interest in the control target.

2.制御システム1の最適化方法
第2節では、制御システム1において、制御装置2のパラメータ最適化方法について説明する。ここでは、例えば制御対象3が二脚歩行ロボットの場合であれば、指定した地点へ移動するという作業を実行するなどであるが、本発明の最適化方法は制御対象3やその作業の種類により限定されるものでは無い。
2. Optimization Method of Control System 1 Section 2 describes a parameter optimization method of the control device 2 in the control system 1. Here, for example, when the controlled object 3 is a bipedal walking robot, a task of moving to a designated point is executed, but the optimization method of the present invention depends on the controlled object 3 and the type of the task. It is not limited.

外乱が少ない環境において、複数回の基本タスクを繰り返し実行することで、前記制御装置2のパラメータを最適化する際の最適化フローを図2に示す。 FIG. 2 shows an optimization flow for optimizing the parameters of the control device 2 by repeatedly executing the basic tasks a plurality of times in an environment with little disturbance.

[最適化開始]
(ステップS1)
基本制御信号生成部231、スパイク信号列生成部232、駆動信号生成部233内の各パラメータ群を初期化する。初期化に用いるパラメータ値は記憶部22に記憶されている情報を用いることができる。記憶部22に記憶されている情報とは不揮発的に継続して記憶されている情報だけでなく、ユーザーが作業開始時に制御対象3の個々の特徴および外部環境状況を鑑みて外部から入力した情報も含む。
[Start optimization]
(Step S1)
Each parameter group in the basic control signal generation unit 231, the spike signal sequence generation unit 232, and the drive signal generation unit 233 is initialized. Information stored in the storage unit 22 can be used as the parameter value used for the initialization. The information stored in the storage unit 22 is not only the information continuously stored in a non-volatile manner, but also information input by the user from the outside in consideration of the individual characteristics of the controlled object 3 and the external environmental condition at the start of work. Including.

基本制御信号生成部231では採用したアルゴリズムにて使用されるパラメータを初期設定する。具体的には、例えばフィードバック制御の一種であるPID(Proportional−Integral−Differential)制御では、比例ゲインK_P、積分ゲインK_I、微分ゲインK_Dなどである。 The basic control signal generation unit 231 initializes the parameters used in the adopted algorithm. Specifically, for example, in PID (Proportional-Integral-Differential) control, which is one type of feedback control, a proportional gain K_P, an integral gain K_I, a differential gain K_D, and the like are used.

スパイク信号列生成部232では確率的スパイキングニューロンネットワーク(sSNN)としてのあらゆるパラメータを初期設定する。例えばスパイク信号列生成部232をLIFニューロンで構成した場合、ニューロン数Nや前記[数1][数2]に含まれる変数、具体的には減衰係数γ、バイアス入力b_ij、ノイズ強度D_i、発火閾値v^θ、リセット電位v_ij^R、不能期間τ_refなどである。 The spike signal sequence generation unit 232 initializes all parameters as a stochastic spiking neuron network (sSNN). For example, when the spike signal sequence generation unit 232 is configured by LIF neurons, the number of neurons N and variables included in the [Formula 1] and [Formula 2], specifically, the attenuation coefficient γ, the bias input b_ij, the noise intensity D_i, and the firing The threshold v^θ, the reset potential v_ij^R, and the disabled period τ_ref.

駆動信号生成部233では、スパイク信号列STから駆動信号ASを生成するのに採用した方式に関するパラメータを初期設定する。例えばローパスフィルタ方式を採用した場合、時定数τや通過域利得などをフィルタ特性値として設定を行なう。駆動信号生成部233の全てもしくは一部を電気的なアナログ回路として構成する場合は、抵抗の抵抗値、コンデンサの容量値などで固定、もしくは半固定的に予め設定しておくことも可能である。 The drive signal generation unit 233 initializes parameters relating to the method adopted to generate the drive signal AS from the spike signal train ST. For example, when the low-pass filter method is adopted, the time constant τ, the passband gain, etc. are set as filter characteristic values. When all or part of the drive signal generation unit 233 is configured as an electrical analog circuit, it is possible to set the resistance value of the resistor, the capacitance value of the capacitor, or the like fixedly or semi-fixedly in advance. ..

(ステップS2)
基本制御信号生成部231、スパイク信号列生成部232、駆動信号生成部233内の各パラメータの更新を行なう。全てのパラメータは更新対象となりうるが、制御部23全体としての概略の方向性は基本制御信号CSに大きく依存するため、基本制御信号生成部231部の最適化を主たる対象とするのが望ましい。スパイク信号列生成部232および駆動信号生成部233に関しては、例えばニューロン数N、シナプス時定数τ_s、ノイズ強度Dを更新対象とし、その他シナプス結合強度に関するパラメータなどは更新しないという制御方法を取ることが可能である。後述のステップS4により収束していないと判定される毎に、前記各パラメータが更新される。
(Step S2)
The parameters in the basic control signal generation unit 231, the spike signal sequence generation unit 232, and the drive signal generation unit 233 are updated. Although all parameters can be updated, the general directionality of the control unit 23 as a whole largely depends on the basic control signal CS, and therefore it is desirable to mainly optimize the basic control signal generation unit 231. Regarding the spike signal sequence generation unit 232 and the drive signal generation unit 233, for example, a control method may be adopted in which the number of neurons N, the synapse time constant τ_s, and the noise intensity D are the update targets, and other parameters related to the synapse connection intensity are not updated. It is possible. Each time the parameter is determined not to converge in step S4 described below, the parameters are updated.

(ステップS3)
制御対象3が制御装置2からの制御に従い基本タスクを実行する。状態検知部31にて制御対象3における前述した各種内部状態を検知し、状態情報を制御装置2内通信部21に送信する。基本制御信号生成部231にて制御対象3全体としての評価値を計算する。後述のステップS4により収束していないと判定される毎に、基本タスクの実行も1回目、2回目、3回目と回数が増えていく。
(Step S3)
The controlled object 3 executes a basic task under the control of the control device 2. The state detection unit 31 detects the above-described various internal states of the control target 3 and transmits the state information to the communication unit 21 in the control device 2. The basic control signal generation unit 231 calculates the evaluation value of the controlled object 3 as a whole. Every time it is determined in step S4 described later that the basic task is not converged, the number of times of execution of the basic task is increased to the first time, the second time, and the third time.

(ステップS4)
基本制御信号生成部231において、システム全体が収束しているかどうかを判定する。収束していない(NO)と判定された場合は、ステップS2に戻ってパラメータ更新作業から継続する。パラメータ更新時における学習アルゴリズムとしては、遺伝アルゴリズムなどの進化戦略を適用することが可能であるが、それに限定するものでは無い。収束している(YES)と判定された場合は作業を終了する。
[最適化終了]
(Step S4)
The basic control signal generation unit 231 determines whether or not the entire system has converged. If it is determined that the values have not converged (NO), the process returns to step S2 to continue from the parameter updating work. As a learning algorithm at the time of updating parameters, an evolution strategy such as a genetic algorithm can be applied, but the learning algorithm is not limited thereto. If it is determined that they have converged (YES), the work ends.
[End of optimization]

3.秩序創発機能
第3節では、本発明の構成における制御装置2が有する秩序創発機能について詳述する。これは、基本制御信号生成部231にて生成した基本制御信号CSから、一旦スパイク信号列生成部232(sSNN)を用いてスパイク信号列STを生成し、さらにその後駆動信号生成部233にて駆動信号ASを生成する構成を有する、本発明における制御装置2固有の機能であり従来知られたものでは無い。
3. Order emergence function In Section 3, the order emergence function of the control device 2 in the configuration of the present invention will be described in detail. This is to generate a spike signal train ST using the spike signal train generator 232 (sSNN) from the basic control signal CS generated by the basic control signal generator 231, and then drive the spike signal train ST with the drive signal generator 233. This is a function unique to the control device 2 of the present invention having a configuration for generating the signal AS, and is not conventionally known.

本節では、秩序創発機能を示す例として、2つの確率的スパイキングニューロンネットワーク(sSNN)を有する場合を図3に示す。ここでは図3の水平軸上に存在する粒子の位置を制御するものとする。図3中S_0、S_1がsSNNで、本発明におけるスパイク信号列生成部232と駆動信号生成部233を内包するものとする。2つのsSNNはそれぞれ入力信号としてI_0(t)、I_1(t)を受け取る。ここでは入力信号I_*(t)は、粒子の現在位置x(t)と目標位置x_0^g、x_1^gの差分量として定義している。スパイク信号列生成部232としてはLIFニューロン(第1節参照)、駆動信号生成部233としてはローパスフィルタ(第1節参照)を使用することとする。 In this section, as an example showing the order emergence function, a case having two stochastic spiking neuron networks (sSNN) is shown in FIG. Here, the position of particles existing on the horizontal axis in FIG. 3 is controlled. In FIG. 3, S_0 and S_1 are sSNN, and include the spike signal train generation unit 232 and the drive signal generation unit 233 of the present invention. The two sSNNs receive I_0(t) and I_1(t) as input signals, respectively. Here, the input signal I_*(t) is defined as a difference amount between the current position x(t) of the particle and the target positions x_0^g and x_1^g. A LIF neuron (see Section 1) is used as the spike signal sequence generation unit 232, and a low-pass filter (see Section 1) is used as the drive signal generation unit 233.

3.1 エントロピー減少・パターン形成機能
図4Aに、3重井戸ポテンシャル関数における質量を持った粒子の位置をsSNNによって制御する場合を示す。ここでは中心(x=0)はポテンシャルの極小値ではあるが最小値ではなく、中心の両側にポテンシャルが最小となる場所が存在する点に留意されたい。
3.1 Entropy reduction/pattern formation function Fig. 4A shows a case where the position of a particle having a mass in the triple well potential function is controlled by sSNN. It should be noted here that the center (x=0) is not the minimum value but the minimum value of the potential, and there are places where the potential is minimum on both sides of the center.

図4A環境下での粒子位置移動状態のシミュレーション結果を図5A、図5Bに示す。横軸は時間t、縦軸は粒子位置xを示す。また図5Aはニューロン数N=2、図5Bはニューロン数N=150の場合である。ApEnは移動状態から算出したエントロピー(Approximate Entropy)である。ニューロン数が少ない図5Aは図5Bに比して粒子の移動量の絶対値は大きいが、これは2箇所存在するポテンシャル最小位置を周期的に移動していることが理由であり、その規則的な周期性のためエントロピーApEnとしては小さい値となっている。この様に確率的スパイキングニューロンネットワーク(sSNN)においてはスパイク性が高いほど、エントロピー減少機能、パターン形成機能が発現する。 5A and 5B show the simulation results of the particle position movement state under the environment of FIG. 4A. The horizontal axis represents time t, and the vertical axis represents particle position x. Further, FIG. 5A shows the case where the number of neurons N=2, and FIG. 5B shows the case where the number of neurons N=150. ApEn is entropy (Approximate Entropy) calculated from the moving state. In FIG. 5A, in which the number of neurons is small, the absolute value of the amount of movement of particles is larger than that in FIG. 5B, but this is because the potential minimum position existing in two places is moved periodically, Due to such periodicity, the entropy ApEn has a small value. As described above, in the stochastic spiking neuron network (sSNN), the higher the spike property, the more the entropy reducing function and the pattern forming function are expressed.

3.2 目標状態の引き込み領域拡大機能
図4Bに、2重井戸ポテンシャル関数における質量を持った粒子の位置をsSNNによって制御する場合を示す。ここでは中心(x=0)はポテンシャルの極大値となっており、車の山登り問題(mountain car task)と同様に、谷底からポテンシャルの極大値x=0に直接到達することは出来ず、反動や外力の助けを必要とする問題設定とする。
3.2 Function of Enlarging Entrainment Area in Target State FIG. 4B shows a case where the position of a particle having a mass in the double well potential function is controlled by sSNN. Here, the center (x=0) is the maximum value of the potential, and as with the mountain climbing problem (mountain car task), the maximum value of the potential x=0 cannot be reached directly from the bottom of the valley, and there is a reaction. The problem setting requires the help of external force.

粒子の初期位置x_0と初期速度v_0を様々に変更して、一定時間以上中心付近[−0.1,0.1]の範囲内にとどまることが出来た場合を引き込み領域と定義してシミュレーションした結果を図6A、図6Bに示す。図6Aはニューロン数N=1、図6Bはニューロン数N=100の場合である。図6A、図6B中白い領域が引き込み領域である。また、バイアス入力bをパラメータにしてニューロン数Nを変化させた場合における引き込み領域割合(basin rate)のシミュレーション結果を図6Cに示す。図6A、図6B、図6Cから明らかな様に確率的スパイキングニューロンネットワーク(sSNN)は引き込み領域を拡大する機能を有しており、sSNNに含まれるニューロン数は少ない方が引き込み領域拡大機能を強く発現する場合が多い。 The initial position x_0 and the initial velocity v_0 of the particle were changed variously, and the case where the particle could stay within the range of the center [-0.1, 0.1] for a certain time or longer was defined as the pull-in area for simulation. The results are shown in FIGS. 6A and 6B. 6A shows the case where the number of neurons N=1, and FIG. 6B shows the case where the number of neurons N=100. White areas in FIGS. 6A and 6B are pull-in areas. Further, FIG. 6C shows a simulation result of a pull-in area ratio (basin rate) when the number N of neurons is changed with the bias input b as a parameter. As is clear from FIGS. 6A, 6B, and 6C, the stochastic spiking neuron network (sSNN) has a function of enlarging the attraction region, and the smaller the number of neurons included in the sSNN, the greater the attraction region. Often expressed strongly.

3.3 自然周波数へのバインディング機能
図4Cに、バネマス系における質量を持った粒子の位置をsSNNによって制御する場合を示す。ここでバネマス系とは1重井戸ポテンシャル関数と等しい。何も制御を行わないバネマス系では、ばね定数kと粒子の質量mで定まる自然周波数f_0(固有周波数)を有している。そのバネマス系に通常のフィードバック制御を行なうと、フィードバック制御のゲインなどの影響により自然周波数f_0が変調されることが知られている。
中心位置(x^g=0)を目標としてsSNNによる制御を実施し、自然周波数f_0に対するSNR(signal−to−noise ratio)をシミュレーションした結果を図7に示す。図7中、横軸はシナプス時定数τ_s、縦軸は増幅ゲインg^Aであり、より白い領域がSNRが高いことを示している。自然周波数f_0が1〜10Hzという非常に広いパラメータ領域において自然周波数f_0への共鳴現象が確認できる。また、多くの領域で白い縞模様が垂直方向に伸びている事から、確率的スパイキングニューロンネットワーク(sSNN)を用いてバネマス系を駆動する場合、自然周波数f_0にほとんど影響を与えてない事が明白である。
3.3 Binding Function to Natural Frequency FIG. 4C shows a case where the position of a particle having a mass in the spring-mass system is controlled by sSNN. Here, the spring-mass system is equal to the single well potential function. A spring-mass system in which no control is performed has a natural frequency f_0 (natural frequency) determined by the spring constant k and the mass m of particles. It is known that when the normal feedback control is performed on the spring mass system, the natural frequency f_0 is modulated due to the influence of the gain of the feedback control.
FIG. 7 shows the result of simulating the SNR (signal-to-noise ratio) with respect to the natural frequency f_0 by performing control by sSNN with the center position (x^g=0) as the target. In FIG. 7, the horizontal axis represents the synaptic time constant τ_s, the vertical axis represents the amplification gain g^A, and the whiter region indicates that the SNR is high. A resonance phenomenon to the natural frequency f_0 can be confirmed in a very wide parameter range where the natural frequency f_0 is 1 to 10 Hz. In addition, since the white stripe pattern extends in the vertical direction in many regions, when the spring-mass system is driven using the stochastic spiking neuron network (sSNN), there is almost no effect on the natural frequency f_0. It's obvious.

4. ロボット制御システム
第4節では、実施形態として、制御対象3としてロボット、さらに具体的には筋骨格ロボットを用いた二脚歩行ロボット制御システムのシミュレーション結果を説明する。
4. Robot Control System In Section 4, a simulation result of a bipedal robot control system using a robot as a control target 3, more specifically, a musculoskeletal robot will be described as an embodiment.

図8にシミュレーションに用いた筋骨格ロボット制御システムの機能概略図を示す。図8左側が骨格(リンク)、関節(ジョイント)、筋(図中Muscleの線、一部省略)の構成を示しており、ロボット駆動部30として各脚毎に8本の筋および多関節筋を接続している。また、ロボット状態検知部31(図8中 Sensory Input)として、筋発生力、筋長、関節角、上体姿勢、重心位置、足裏反力、各骨(リンク)において9軸慣性計測装置(Inertia Measurement Unit)によって得られる3軸姿勢、3軸加速度、3軸角速度を測定可能な構成である。 FIG. 8 shows a functional schematic diagram of the musculoskeletal robot control system used in the simulation. The left side of FIG. 8 shows a structure of a skeleton (link), a joint (joint), and a muscle (muscle line in the drawing, a part of which is omitted). As the robot driving unit 30, eight muscles and multi-joint muscles are provided for each leg. Are connected. Further, as the robot state detection unit 31 (Sensory Input in FIG. 8), a muscle generating force, a muscle length, a joint angle, a body posture, a center of gravity position, a sole reaction force, a 9-axis inertial measurement device for each bone (link) ( This is a configuration capable of measuring the triaxial posture, triaxial acceleration, and triaxial angular velocity obtained by the Inertia Measurement Unit).

左右各脚は静止、振り動作など複数の相を有しており、各相毎に異なる反射活性化ルールを持っている。反射活性化ルール(図8中Reflex System:基本制御信号生成部231)は発生力のポジティブフィードバック制御ルール、筋長のフィードバック制御ルール、関節角あるいは上体姿勢のPD(比例微分)制御ルールの組合せで構築される。 Each of the left and right legs has a plurality of phases such as a stationary motion and a swing motion, and each phase has a different reflex activation rule. The reflex activation rule (Reflex System: basic control signal generation unit 231 in FIG. 8) is a combination of a positive feedback control rule for generated force, a feedback control rule for muscle length, and a PD (proportional derivative) control rule for joint angle or body posture. Built in.

図9A、図9B、図9Cには、滑りやすい低摩擦環境での重心移動速度シミュレーション結果を示す。図9A、図9Bの横軸が時間t、縦軸が重心移動速度v^gである。通常(図中破線)の摩擦係数μは10としているが、低摩擦環境(図中実線)では時間t=[10,40]にて摩擦係数μを0.04と低く設定している。図9A、図9Bより通常環境、低摩擦環境ともに安定した二脚歩行動作が行われている。そのとき通常環境よりも低摩擦環境の方が全体に低速度側にシフトしている。図9Cは歩容周波数と振幅の関係を示したもので、低摩擦環境では低周波数側に遷移している。 FIG. 9A, FIG. 9B, and FIG. 9C show the results of center-of-gravity movement speed simulation in a slippery low-friction environment. 9A and 9B, the horizontal axis represents time t, and the vertical axis represents the center-of-gravity moving speed v^g. The friction coefficient μ is normally 10 (broken line in the figure), but in a low friction environment (solid line in the figure), the friction coefficient μ is set as low as 0.04 at time t=[10, 40]. As shown in FIGS. 9A and 9B, stable bipedal walking is performed in both the normal environment and the low friction environment. At that time, the low friction environment shifts to the lower speed side as a whole than the normal environment. FIG. 9C shows the relationship between the gait frequency and the amplitude, and transitions to the low frequency side in a low friction environment.

図10には大きな滑りが発生した状況における協調運動能力シミュレーション結果を示す。図10A、図10Cは横軸xが位置を示し、x=[4,16]を低摩擦区間とし摩擦係数μ=0.04、それ以外は通常で摩擦係数μ=10である。なお、図10Aのサンプリング間隔は0.1s、図10Cのサンプリング間隔は0.25sである。低摩擦区間(図中slippery帯)上にある、黒色帯は右足の滑り、灰色帯は左足の滑りを示している。図10B、図10Dは、それぞれ図10A、図10Cに対応する時間tと重心移動速度v^gの関係を示している。 FIG. 10 shows the results of the cooperative motor performance simulation in the situation where a large slip has occurred. In FIGS. 10A and 10C, the horizontal axis x indicates the position, x=[4,16] is the low friction section, and the friction coefficient μ=0.04, and otherwise the friction coefficient μ=10. The sampling interval in FIG. 10A is 0.1 s, and the sampling interval in FIG. 10C is 0.25 s. On the low friction zone (slippery band in the figure), the black band indicates the slip of the right foot, and the gray band indicates the slip of the left foot. 10B and 10D show the relationship between the time t and the center-of-gravity moving speed v^g corresponding to FIGS. 10A and 10C, respectively.

図10A、図10Bにおいては、0.5s以上の時間、0.5m程度の滑りが発生しているが、それに適応して歩行が継続出来ている。この際、左右の足で滑る距離が非対称になっている点に留意されたい。また、図10C、図10Dでは低摩擦区間終了地点であるx=16m、t=13s付近でv^gが極端に下がっており、これは低摩擦区間終了直前におけるやや長めの右足滑りから通常区間に入るときに転倒寸前の状態となったことを示している。この状況でも、つま先などが通常区間(μ=10)である滑りづらい地面に接触していることを足がかりとして、正常歩行に復帰することが出来ている。この様に、従来知られている反射回路のみの制御では実現困難であった、非常に高い適応能力を、本発明による制御装置2を用いたロボット制御システムは有している。 In FIG. 10A and FIG. 10B, a slip of about 0.5 m occurs for a time of 0.5 s or more, but the walking can be adapted to this. At this time, it should be noted that the sliding distance between the left and right feet is asymmetric. Further, in FIGS. 10C and 10D, v^g is extremely decreased near x=16 m, t=13 s, which is the end point of the low friction section, which is a little longer from the right foot slip just before the end of the low friction section to the normal section. It indicates that the vehicle was about to fall when entering. Even in this situation, it is possible to return to normal walking by using the fact that the toes and the like are in contact with the non-slip ground, which is the normal section (μ=10), as a foothold. As described above, the robot control system using the control device 2 according to the present invention has a very high adaptability, which has been difficult to realize by the conventionally known control of only the reflection circuit.

本節で説明した二脚歩行ロボット制御システムにおける協調動作には、運動系列のエントロピーを低減する必要がある。また、転倒回避にはZMP(zero−moment point)をある範囲内に制御する必要もある。第3節にて説明した通り、本発明における制御装置2が有する秩序創発機能(3.1 エントロピー減少・パターン形成機能、3.2 目標状態の引き込み領域拡大機能を参照されたい)が有効に働くことで、即時的な転倒回避機能が実現されていると言える。 For the coordinated operation in the bipedal robot control system described in this section, it is necessary to reduce the entropy of the motion sequence. Further, in order to avoid falling, it is necessary to control ZMP (zero-moment point) within a certain range. As described in Section 3, the ordered emergence function (see 3.1 Entropy reduction/pattern formation function, 3.2 Target state expansion region expansion function) of the control device 2 of the present invention works effectively. Therefore, it can be said that the instant fall avoidance function is realized.

5.変形例
なお、次のような態様によって、本実施形態を更に創意工夫してもよい。
5. Modification Note that the present embodiment may be further devised in the following manner.

第4節では、二脚歩行ロボット制御システムの実施形態について説明したが、一般に移動システムでは移動に伴い外部環境の変動を伴うものであり、秩序創発機能を有する本発明の制御装置2の特徴を活かすことが出来る。また、秩序創発機能は、無人による完全自律型制御システムとして、あるいは有人システムの補助的な制御システムどちらでも活用することが出来る。移動システムとしては、具体的には例えば、多足歩行ロボット、車輪・キャタピラ型ロボット、無人航空機(Unmanned Aerial Vehicle:UAV、ドローン)、無人水上艇(Unmanned Surface Vehicle:USV)、無人潜水艇(Unmanned Underwater Vehicle:UUV)、自動運転を含む自動車、航空機、船舶などであるが、これらに限定されるものでは無い。 In the fourth section, the embodiment of the bipedal walking robot control system has been described. However, in the mobile system, the external environment generally changes with the movement, and the characteristics of the control device 2 of the present invention having the order emergence function are described. You can take advantage of it. In addition, the order emergence function can be utilized either as an unmanned fully autonomous control system or as an auxiliary control system of a manned system. Specific examples of the moving system include a multi-legged walking robot, a wheel/caterpillar robot, an unmanned aircraft (Unmanned Aerial Vehicle: UAV, drone), an unmanned surface vehicle (USV), and an unmanned submersible (Unmanned). Underwater Vehicle (UUV), automobiles including autonomous driving, aircraft, ships, etc., but are not limited to these.

さらには、運搬や加工に関して作業対象物が頻繁に変更される産業用・医療用・農業用・家庭用のロボットにも適用可能である。 Furthermore, it is also applicable to industrial, medical, agricultural, and household robots whose work objects are frequently changed in transportation and processing.

本発明による制御装置2が持つ秩序創発機能は、状態の変動に適応する必要がある制御システム1であれば技術分野を限定するものでは無い。すなわち機械的な運動に対するものだけでは無く、電気的変動あるいは化学反応的変動に対しても発揮することが可能である。さらには、金融システムの制御やインターネットなどのコミュニケーションネットワークにおける情報の流入・流出・伝播の制御、空調システム、などにも適用可能である事が期待できる。したがって、例えば秩序創発機能のうち自然周波数へのバインディング機能(3.3参照)を活用した心臓ペースメーカーや人工心肺などへ応用することも可能である。 The order emergence function of the control device 2 according to the present invention is not limited to the technical field as long as it is the control system 1 that needs to adapt to changes in the state. That is, it can be exerted not only for mechanical movement but also for electrical fluctuation or chemical reaction fluctuation. Furthermore, it can be expected to be applicable to control of financial systems, control of inflow/outflow/propagation of information in communication networks such as the Internet, and air conditioning systems. Therefore, for example, it can be applied to a cardiac pacemaker or an artificial heart-lung machine that utilizes the function of binding to natural frequencies (see 3.3) among the function of emergence of order.

本発明におけるスパイク信号列生成部232および駆動信号生成部233は、図1に示した様に、基本制御信号生成部231、通信部21、記憶部22などと共に1つの制御装置2として構成することも可能であるが、スパイク信号列生成部232と駆動信号生成部233を外付け制御装置とすることも可能である。 As shown in FIG. 1, the spike signal train generation unit 232 and the drive signal generation unit 233 according to the present invention should be configured as one control device 2 together with the basic control signal generation unit 231, the communication unit 21, the storage unit 22, and the like. However, the spike signal train generation unit 232 and the drive signal generation unit 233 can be used as an external control device.

図11に機能ブロック図を示す。図11中、2bが基本制御信号CSを生成する基本制御装置、3が制御対象である。基本制御装置2bと制御対象3の組合せだけでも従来方式の制御は可能であるが、その従来制御を補足すべく外付け制御装置2aを接続している。外付け制御装置2aにはスパイク信号列生成部232および駆動信号生成部233が配備されている。既存の制御システムに外付け制御装置2aを追加することで、第3節で説明した秩序創発機能を活用することが可能となり、制御システム1の機能・性能を向上することが出来る。 FIG. 11 shows a functional block diagram. In FIG. 11, 2b is a basic control device that generates a basic control signal CS, and 3 is a control target. Although the conventional control is possible only by combining the basic control device 2b and the controlled object 3, the external control device 2a is connected to supplement the conventional control. The external control device 2a is provided with a spike signal train generation unit 232 and a drive signal generation unit 233. By adding the external control device 2a to the existing control system, the order emergence function described in Section 3 can be utilized and the function/performance of the control system 1 can be improved.

さらには、スパイク信号列は撹乱に起因して確率的に生成されるものに限らず、十分な複雑さと予測不能性を含むならばカオスなどを利用して決定論的に生成されたスパイク信号列であっても同等の機能を得る事が出来る。 Furthermore, spike signal sequences are not limited to those generated stochastically due to disturbance, and spike signal sequences generated deterministically using chaos, etc. if they have sufficient complexity and unpredictability. However, the same function can be obtained.

6.結言
以上のように、本実施形態によれば、予期しない外的環境の変化が発生しても、自律的に反応し、制御システム1全体が所望の動作を行なうことを可能とする制御装置2を実施することが出来る。
6. Conclusion As described above, according to the present embodiment, even if an unexpected external environment change occurs, the control device 2 that reacts autonomously and enables the entire control system 1 to perform a desired operation. Can be implemented.

かかる制御装置2は、駆動信号を制御対象3に供給することで前記制御対象3を制御可能に構成されるもので、スパイク信号列生成部232と駆動信号生成部233とを備え、前記スパイク信号列生成部232は、前記制御対象3を制御するための基本制御信号CSおよび擾乱を含む内部状態によって規定されるタイミングで、スパイク信号列STを生成可能に構成され、前記駆動信号生成部は、前記スパイク信号列STに基づいて時系列に連続変化する前記駆動信号ASを生成可能に構成される。 The control device 2 is configured to control the control target 3 by supplying a drive signal to the control target 3, and includes a spike signal train generation unit 232 and a drive signal generation unit 233. The column generation unit 232 is configured to be able to generate the spike signal sequence ST at a timing defined by an internal state including a basic control signal CS for controlling the controlled object 3 and the disturbance, and the drive signal generation unit is The drive signal AS that continuously changes in time series is generated based on the spike signal train ST.

また、これにより以下の制御システム1を実施することが出来る。 Moreover, the following control system 1 can be implemented by this.

かかる制御システム1は、制御対象3と、前記制御対象3を制御する制御装置2とを備え、
前記制御対象3は、ロボット、移動体、ペースメーカー、電気回路系、および化学反応系の少なくとも1つであり、前記制御装置2は、上に記載した制御装置2である。
The control system 1 includes a control target 3 and a control device 2 that controls the control target 3.
The control target 3 is at least one of a robot, a mobile body, a pacemaker, an electric circuit system, and a chemical reaction system, and the control device 2 is the control device 2 described above.

制御装置2また制御システム1をハードウェアとして実施するためのソフトウェアを、プログラムとして実施することもできる。そして、このようなプログラムを、コンピュータが読み取り可能な非一時的な記録媒体として提供してもよいし、外部のサーバからダウンロード可能に提供してもよいし、外部のコンピュータで当該プログラムを起動させて、クライアント端末で各機能を実施可能な、いわゆるクラウド・コンピューティングを実施してもよい。 Software for implementing the control device 2 or the control system 1 as hardware can also be implemented as a program. Then, such a program may be provided as a computer-readable non-transitory recording medium, or may be provided so as to be downloadable from an external server, or the program may be activated by an external computer. Then, so-called cloud computing, in which each function can be performed by the client terminal, may be performed.

かかる制御プログラムは、制御対象を制御するためのもので、コンピュータに、スパイク信号列生成機能と駆動信号生成機能とを実行させるもので、前記スパイク信号列生成機能によれば、前記制御対象3を制御するための基本制御信号CSと擾乱を含む内部状態とによって規定されるタイミングで、スパイク信号列STを生成させ、前記駆動信号生成機能によれば、前記スパイク信号列STに基づいて時系列に連続変化する前記駆動信号ASを生成させることとする。 Such a control program is for controlling a controlled object, and causes a computer to execute a spike signal sequence generation function and a drive signal generation function. According to the spike signal sequence generation function, the control target 3 is controlled. The spike signal train ST is generated at a timing defined by the basic control signal CS for controlling and the internal state including the disturbance, and according to the drive signal generation function, the spike signal train ST is time-series based on the spike signal train ST. The drive signal AS that continuously changes is generated.

最後に、本発明に係る種々の実施形態を説明したが、これらは、例として提示したものであり、発明の範囲を限定することは意図していない。当該新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。当該実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。 Lastly, various embodiments according to the present invention have been described, but these are presented as examples and are not intended to limit the scope of the invention. The novel embodiment can be implemented in various other forms, and various omissions, replacements, and changes can be made without departing from the spirit of the invention. The embodiment and its modifications are included in the scope and gist of the invention, and are also included in the invention described in the claims and the scope equivalent thereto.

1 :制御システム
2 :制御装置
2a :外付け制御装置
2b :基本制御装置
20 :通信バス
21 :通信部
22 :記憶部
23 :制御部
231 :基本制御信号生成部
232 :スパイク信号列生成部
233 :駆動信号生成部
3 :制御対象
30 :駆動部
31 :状態検知部
CS :制御信号
ST :スパイク信号列
AS :駆動信号
I :入力信号
ApEn :エントロピー
N :ニューロン数
x_0 :初期位置
v_0 :初期速度
b :バイアス入力
f_0 :自然周波数
τ_s :シナプス時定数
g^A :増幅ゲイン
v^g :重心移動速度
μ :摩擦係数
1: control system 2: control device 2a: external control device 2b: basic control device 20: communication bus 21: communication unit 22: storage unit 23: control unit 231: basic control signal generation unit 232: spike signal sequence generation unit 233 : Drive signal generation unit 3: Control object 30: Drive unit 31: State detection unit CS: Control signal ST: Spike signal train AS: Drive signal I: Input signal ApEn: Entropy N: Number of neurons x_0: Initial position v_0: Initial velocity b: Bias input f_0: Natural frequency τ_s: Synapse time constant g^A: Amplification gain v^g: Center-of-gravity moving speed μ: Friction coefficient

Claims (7)

制御装置であって、駆動信号を制御対象に供給することで前記制御対象を制御可能に構成されるもので、
スパイク信号列生成部と駆動信号生成部とを備え、
前記スパイク信号列生成部は、前記制御対象を制御するための基本制御信号と擾乱を含む内部状態、および内部状態に関するダイナミクスによって規定されるタイミングで、スパイク信号列を生成可能に構成され、
前記駆動信号生成部は、前記スパイク信号列に基づいて時系列に連続変化する前記駆動信号を生成可能に構成される、
制御装置。
A control device, which is configured to control the control target by supplying a drive signal to the control target,
A spike signal train generation unit and a drive signal generation unit,
The spike signal string generation unit is configured to generate a spike signal string at a timing defined by a basic control signal for controlling the controlled object and an internal state including a disturbance, and dynamics related to the internal state,
The drive signal generation unit is configured to be capable of generating the drive signal that continuously changes in time series based on the spike signal train.
Control device.
請求項1記載の制御装置において、
通信部と基本制御信号生成部とをさらに備え、
前記通信部は、前記制御対象の状態情報を受信可能に構成され、ここで、
前記状態情報とは、前記制御対象における注目する箇所において、制御対象の挙動および環境変動により変化する内部状態を示す情報で、
前記基本制御信号生成部は、前記状態情報に基づいて前記基本制御信号を生成可能に構成される、
制御装置。
The control device according to claim 1,
Further comprising a communication unit and a basic control signal generation unit,
The communication unit is configured to be able to receive the state information of the control target, where:
The state information, at a point of interest in the control target, is information indicating an internal state that changes due to the behavior of the control target and environmental changes,
The basic control signal generation unit is configured to generate the basic control signal based on the state information,
Control device.
請求項1または請求項2記載の制御装置において、
前記スパイク信号列生成部は、
ニューロンネットワークを構成する複数のニューロンを有し、
前記複数のニューロンそれぞれによって出力される信号に基づいて、1つのニューロンネットワークによって前記スパイク信号列を生成可能に構成される、
制御装置。
In the control device according to claim 1 or 2,
The spike signal train generation unit,
Having multiple neurons that make up a neuron network,
It is configured such that the spike signal train can be generated by one neuron network based on the signals output by each of the plurality of neurons.
Control device.
請求項1〜請求項3の何れか1つに記載の制御装置において、
前記スパイク信号列生成部のニューロンは、生体における確率的なインパルス状の活動電位の生成をモデルとして、前記スパイク信号を生成可能に構成される、
制御装置。
The control device according to any one of claims 1 to 3,
The neuron of the spike signal sequence generation unit is configured to be able to generate the spike signal by using generation of a stochastic impulse-like action potential in a living body as a model.
Control device.
制御システムであって、
制御対象と、前記制御対象を制御する制御装置とを備え、
前記制御対象は、ロボット、移動体、ペースメーカー、電気回路系、化学反応系、通信ネットワーク、社会経済管理システム、金融システム、生体ネットワークおよび動植物の少なくとも1つであり、
前記制御装置は、請求項1〜請求項4の何れか1つに記載の制御装置である、
制御システム。
A control system,
A control target, and a control device for controlling the control target,
The control target is at least one of a robot, a mobile body, a pacemaker, an electric circuit system, a chemical reaction system, a communication network, a socioeconomic management system, a financial system, a biological network, and animals and plants,
The control device is the control device according to any one of claims 1 to 4.
Control system.
請求項5記載の制御システムにおいて、
前記制御対象は筋骨格ロボットであり、ロボット駆動部とロボット状態検知部とを備え、
前記ロボット駆動部は、複数の骨と、複数の関節と、近接する前記骨どうしの間に引っ張り力を与える筋および/または前記複数の骨にまたがり引っ張り力を与える多関節筋を備え、
前記ロボット状態検知部は、筋発生力、筋長、関節角、上体姿勢、重心位置、足裏反力、3軸姿勢、3軸加速度、3軸角速度の少なくとも1つの状態を検知可能に構成される、
制御システム。
The control system according to claim 5,
The control target is a musculoskeletal robot, and includes a robot drive unit and a robot state detection unit,
The robot driving unit includes a plurality of bones, a plurality of joints, a muscle that applies a tensile force between adjacent bones, and/or a multi-joint muscle that applies a tensile force across the plurality of bones,
The robot state detection unit is configured to detect at least one state of muscle force, muscle length, joint angle, body posture, center of gravity position, sole reaction force, 3-axis posture, 3-axis acceleration, and 3-axis angular velocity. Will be
Control system.
制御プログラムであって、制御対象を制御するためのもので、
コンピュータに、スパイク信号列生成機能と駆動信号生成機能とを実行させるもので、
前記スパイク信号列生成機能によれば、前記制御対象を制御するための基本制御信号と擾乱を含む内部状態とによって規定されるタイミングで、スパイク信号列を生成させ、
前記駆動信号生成機能によれば、前記スパイク信号列に基づいて時系列に連続変化する前記駆動信号を生成させる、
制御プログラム。
A control program for controlling a controlled object,
It causes the computer to execute the spike signal train generation function and the drive signal generation function.
According to the spike signal train generation function, a spike signal train is generated at a timing defined by a basic control signal for controlling the controlled object and an internal state including a disturbance,
According to the drive signal generation function, the drive signal that continuously changes in time series is generated based on the spike signal train,
Control program.
JP2019014886A 2019-01-30 2019-01-30 Control devices, control systems, and control programs Active JP7421719B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019014886A JP7421719B2 (en) 2019-01-30 2019-01-30 Control devices, control systems, and control programs
PCT/JP2020/001427 WO2020158439A1 (en) 2019-01-30 2020-01-17 Control device, control system, and control program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019014886A JP7421719B2 (en) 2019-01-30 2019-01-30 Control devices, control systems, and control programs

Publications (2)

Publication Number Publication Date
JP2020121376A true JP2020121376A (en) 2020-08-13
JP7421719B2 JP7421719B2 (en) 2024-01-25

Family

ID=71840320

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019014886A Active JP7421719B2 (en) 2019-01-30 2019-01-30 Control devices, control systems, and control programs

Country Status (2)

Country Link
JP (1) JP7421719B2 (en)
WO (1) WO2020158439A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113084814A (en) * 2021-04-13 2021-07-09 中国科学院自动化研究所 Method for realizing motion control of musculoskeletal robot based on distributed position optimization
CN113084813A (en) * 2021-04-13 2021-07-09 中国科学院自动化研究所 Robot motion control method for optimally constructing constraint force field based on muscle parameters

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5471381A (en) * 1990-09-20 1995-11-28 National Semiconductor Corporation Intelligent servomechanism controller
JP2006514759A (en) * 2002-08-21 2006-05-11 ニューヨーク・ユニバーシティ Neuromimetic control system and method
US20070129648A1 (en) * 2000-05-04 2007-06-07 Ralph Etienne-Cummings Biomorphic rhythmic movement controller
US20130325768A1 (en) * 2012-06-04 2013-12-05 Brain Corporation Stochastic spiking network learning apparatus and methods
US20140081895A1 (en) * 2012-09-20 2014-03-20 Oliver Coenen Spiking neuron network adaptive control apparatus and methods
JP2018136918A (en) * 2016-12-20 2018-08-30 インテル・コーポレーション Autonomous navigation using spiking neuromorphic computers

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5471381A (en) * 1990-09-20 1995-11-28 National Semiconductor Corporation Intelligent servomechanism controller
US20070129648A1 (en) * 2000-05-04 2007-06-07 Ralph Etienne-Cummings Biomorphic rhythmic movement controller
JP2006514759A (en) * 2002-08-21 2006-05-11 ニューヨーク・ユニバーシティ Neuromimetic control system and method
US20130325768A1 (en) * 2012-06-04 2013-12-05 Brain Corporation Stochastic spiking network learning apparatus and methods
US20140081895A1 (en) * 2012-09-20 2014-03-20 Oliver Coenen Spiking neuron network adaptive control apparatus and methods
JP2018136918A (en) * 2016-12-20 2018-08-30 インテル・コーポレーション Autonomous navigation using spiking neuromorphic computers

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
平田 弘志 他: "適応制御器を用いた回転型二重倒立振子の二段階による制御系 Control System with Two Stages Using Adapt", 電気学会論文誌C 電子・情報・システム部門誌, vol. 第130巻 第11号, JPN6023046719, 1 November 2010 (2010-11-01), JP, pages 1968 - 1978, ISSN: 0005195058 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113084814A (en) * 2021-04-13 2021-07-09 中国科学院自动化研究所 Method for realizing motion control of musculoskeletal robot based on distributed position optimization
CN113084813A (en) * 2021-04-13 2021-07-09 中国科学院自动化研究所 Robot motion control method for optimally constructing constraint force field based on muscle parameters
CN113084813B (en) * 2021-04-13 2022-05-03 中国科学院自动化研究所 Robot motion control method for optimally constructing constraint force field based on muscle parameters
CN113084814B (en) * 2021-04-13 2022-05-10 中国科学院自动化研究所 Method for realizing motion control of musculoskeletal robot based on distribution position optimization

Also Published As

Publication number Publication date
JP7421719B2 (en) 2024-01-25
WO2020158439A1 (en) 2020-08-06

Similar Documents

Publication Publication Date Title
Thor et al. Generic neural locomotion control framework for legged robots
Aoi et al. Stability analysis of a simple walking model driven by an oscillator with a phase reset using sensory feedback
WO2020158439A1 (en) Control device, control system, and control program
Antonova et al. Sample efficient optimization for learning controllers for bipedal locomotion
Szczecinski et al. Introducing MantisBot: hexapod robot controlled by a high-fidelity, real-time neural simulation
Doshi et al. Effective locomotion at multiple stride frequencies using proprioceptive feedback on a legged microrobot
Couceiro et al. Introducing the fractional order robotic Darwinian PSO
Yang et al. Cajun: Continuous adaptive jumping using a learned centroidal controller
Dzeladini et al. CPG-based control of humanoid robot locomotion
Inoue et al. CPG-based control of a simulated snake-like robot adaptable to changing ground friction
Barikhan et al. Multiple decoupled cpgs with local sensory feedback for adaptive locomotion behaviors of bio-inspired walking robots
Larsen et al. Self‐Organized Stick Insect‐Like Locomotion under Decentralized Adaptive Neural Control: From Biological Investigation to Robot Simulation
Bhat et al. Towards a learnt neural body schema for dexterous coordination of action in humanoid and industrial robots
Abdolmaleki et al. Contextual policy search for generalizing a parameterized biped walking controller
Shirwatkar et al. Force control for robust quadruped locomotion: A linear policy approach
Cristiano et al. Deterministic phase resetting with predefined response time for CPG networks based on Matsuoka’s oscillator
Choi et al. Automated synthesis of scalable algorithms for inferring non-local properties to assist in multi-robot teaming
Araujo et al. Self-organizing map with time-varying structure to plan and control artificial locomotion
Manoonpong et al. Reservoir-based online adaptive forward models with neural control for complex locomotion in a hexapod robot
Matsuo et al. Adaptative motion control system of a snake-like robot using a neural oscillator netowork
Son et al. Bio-insect and artificial robot interaction using cooperative reinforcement learning
Inoue et al. Soft bodies as input reservoir: role of softness from the viewpoint of reservoir computing
Wang et al. Bio-inspired navigation of mobile robots
Shimoda et al. Neural computation scheme of compound control: tacit learning for bipedal locomotion
Turanli et al. Multi-robot collaborative coverage under localization uncertainty

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20190823

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20190823

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220906

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20221104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230425

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230615

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230804

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231226

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231227

R150 Certificate of patent or registration of utility model

Ref document number: 7421719

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150