JP2003200369A - ロボット装置及びその制御方法、人工エージェント、記憶制御装置及び記憶制御方法 - Google Patents

ロボット装置及びその制御方法、人工エージェント、記憶制御装置及び記憶制御方法

Info

Publication number
JP2003200369A
JP2003200369A JP2001394889A JP2001394889A JP2003200369A JP 2003200369 A JP2003200369 A JP 2003200369A JP 2001394889 A JP2001394889 A JP 2001394889A JP 2001394889 A JP2001394889 A JP 2001394889A JP 2003200369 A JP2003200369 A JP 2003200369A
Authority
JP
Japan
Prior art keywords
input
neuron
learning rate
memory
competitive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001394889A
Other languages
English (en)
Inventor
Nobuya Otani
伸弥 大谷
Jun Yokono
順 横野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2001394889A priority Critical patent/JP2003200369A/ja
Publication of JP2003200369A publication Critical patent/JP2003200369A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Toys (AREA)
  • Manipulator (AREA)
  • Feedback Control In General (AREA)

Abstract

(57)【要約】 【課題】 生命体の成長の度合いや情報の確信度などに
応じて記憶能力を動的に変更して、擬似生命体らしく、
効率的な記憶を行なう。 【解決手段】 競合型ニューラル・ネットワークを適用
した連想記憶システムにおいて、学習率αを変化させる
によって記憶能力を制御する。例えば、学習率を成長時
間tに応じて変化する関数として扱うことにより、成長
過程に応じて記憶能力を動的に変化させる。また、競合
に勝ち抜いた競合ニューロンの値yiとそれ以外の出力
ニューロンykとの差が大きければ大きいほど記憶の確
からしさが高いので、確からしさに応じて学習率αを変
化させて、効率的な記憶を行なう。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、生命体を模倣し、
成長するロボット装置及びその制御方法、人工エージェ
ントに係り、特に、事物を記憶する記憶能力を備えて記
憶内容を基に自律的に動作するロボット装置及びその制
御方法、人工エージェント、記憶制御装置及び記憶制御
方法に関する。
【0002】さらに詳しくは、本発明は、記憶能力に変
化を持たせて、よりリアルでユーザに飽きさせないイン
タラクションを行なうロボット装置及びその制御方法、
人工エージェント、記憶制御装置及び記憶制御方法に係
り、特に、生命体の成長の度合いや情報の確信度などに
応じて記憶能力を動的に変更して、擬似生命体らしく、
効率的な記憶を行なうロボット装置及びその制御方法、
人工エージェント、記憶制御装置及び記憶制御方法に関
する。
【0003】
【従来の技術】電気的若しくは磁気的な作用を用いて人
間の動作に似せた運動を行う機械装置のことを「ロボッ
ト」という。ロボットの語源は、スラブ語の"ROBO
TA(奴隷機械)"に由来すると言われている。わが国で
は、ロボットが普及し始めたのは1960年代末からで
あるが、その多くは、工場における生産作業の自動化・
無人化などを目的としたマニピュレータや搬送ロボット
などの産業用ロボット(industrial robot)であった。
【0004】最近では、イヌやネコ、クマのように4足
歩行の動物の身体メカニズムやその動作を模したペット
型ロボット、あるいは、ヒトやサルなどの2足直立歩行
を行う動物の身体メカニズムや動作を模した「人間形」
若しくは「人間型」のロボット(humanoid robot)な
ど、脚式移動ロボットに関する研究開発が進展し、実用
化への期待も高まってきている。これら脚式移動ロボッ
トは、クローラ式ロボットに比し不安定で姿勢制御や歩
行制御が難しくなるが、階段の昇降や障害物の乗り越え
など、柔軟な歩行・走行動作を実現できるという点で優
れている。
【0005】脚式移動ロボットの用途の1つとして、産
業活動・生産活動等における各種の難作業の代行が挙げ
られる。例えば、原子力発電プラントや火力発電プラン
ト、石油化学プラントにおけるメンテナンス作業、製造
工場における部品の搬送・組立作業、高層ビルにおける
清掃、火災現場その他における救助といったような危険
作業・難作業の代行などである。
【0006】また、脚式移動ロボットの他の用途とし
て、上述の作業支援というよりも、生活密着型、すなわ
ち人間との「共生」あるいは「エンターティンメント」
という用途が挙げられる。この種のロボットは、ヒトあ
るいはイヌ(ペット)、クマなどの比較的知性の高い脚
式歩行動物の動作メカニズムやその感情表現を忠実に再
現する。また、あらかじめ入力された動作パターンを単
に忠実に実行するだけではなく、ユーザ(あるいは他の
ロボット)から受ける言葉や態度(「褒める」とか「叱
る」、「叩く」など)に対して動的に対応した、生き生
きとした応答表現を実現することも要求される。
【0007】従来の玩具機械は、ユーザ操作と応答動作
との関係が固定的であり、玩具の動作をユーザの好みに
合わせて変更することはできない。この結果、ユーザは
同じ動作しか繰り返さない玩具をやがては飽きてしまう
ことになる。
【0008】これに対し、自律動作を行うインテリジェ
ントなロボット装置は、一般に、外界の情報を認識して
それに対して自身の行動を反映させる機能を持ってい
る。すなわち、ロボット装置は、外部環境からの音声や
画像、触覚などの入力情報に基づいて感情モデルや本能
モデルを変化させて動作を決定することにより、自律的
な思考及び動作制御を実現する。この結果、ロボット装
置は、より高度な知的レベルで人間とのリアリスティッ
クなインターラクションやコミュニケーションを実現す
ることも可能となる。
【0009】
【発明が解決しようとする課題】人が他とインタラクシ
ョンするときには、一般に、相手も自分と同じ程度の機
能を有していることを期待していると思料される。これ
は、上述したようなロボット装置以外にも、生命体を模
擬するその他のタイプの電子エージェント(以下では、
これらを総じて「人工エージェント」とも呼ぶ)とイン
タラクションする場合も同様であり、人工エージェント
に対して「人と同じような」振る舞いを期待している。
【0010】従来の人工エージェントでは、成長に合っ
た動作(action)や行動(behavior)を行わせて、「人
と同じような成長」を表現しようとしている。
【0011】ところが、「記憶する」という動作に関し
ては成長に合った動作の概念とは別に考えられるのが一
般的であり、学習効率や記憶能力に変化は生じない。こ
のため、例えば記憶能力が低いまま一定である人工エー
ジェントは、好奇心が高い幼少期であっても学習したこ
とを覚えないという現象が生じてしまうし、逆に高いま
ま一定ならば成熟期になっても記憶データの更新が頻発
してしまい、記憶がいつまでも安定しないという現象が
生じてしまう。
【0012】このように「記憶能力」に変化は生じない
人工エージェントと実際にユーザがインタラクションを
行った場合について考察してみる。例えば、記憶能力が
低いまま一定である人工エージェントに対しては、人工
エージェントが幼少期においては、ユーザとのインタラ
クションで利用した物体情報や経験知識を「人の幼少
期」と同じようにすぐに記憶していて欲しいと期待する
であろ。それにもかかわらず記憶はあまり行われない。
逆に、高いまま一定の人工エージェントに対しては、ユ
ーザは、成熟期になったとき「人の成熟期」と同じよう
に人工エージェントの経験を最大限に活かしたことを表
出させたいと考え、記憶データの更新は頻発しないで欲
しいと期待してしまうであろう。それにもかかわらず記
憶データの更新は頻発してしまう。
【0013】このような状況では、人工エージェントが
「人と同じような」成長をユーザに飽きさせないほど十
分に模擬することは不可能である。
【0014】また、人間の記憶メカニズムは、確信が持
てないような情報に対しては、あまり強く記憶すること
はなく、記憶情報の混乱を起こさないような構造を持っ
ていると考えられる。
【0015】しかしながら、従来の人工エージェントの
記憶機能では、学習しようとしたデータに対しては、情
報の確信度の如何によらず同じように学習してしまう。
このような観点からも、人口エージェントは「人と同じ
ような」記憶機能をユーザに飽きさせないほど十分に模
擬することは不可能であると言わざるを得ない。
【0016】本発明は、上述したような技術的課題を鑑
みたものであり、その主な目的は、事物を記憶する記憶
能力を備えて記憶内容を基に自律的に動作することがで
きる、優れたロボット装置及びその制御方法、人工エー
ジェント、記憶制御装置及び記憶制御方法を提供するこ
とにある。
【0017】本発明の更なる目的は、記憶能力に変化を
持たせて、よりリアルでユーザに飽きさせないインタラ
クションを行なうことができる、優れたロボット装置及
びその制御方法、人工エージェント、記憶制御装置及び
記憶制御方法を提供することにある。
【0018】本発明の更なる目的は、生命体の成長の度
合いや情報の確信度などに応じて記憶能力を動的に変更
して、擬似生命体らしく、且つ効率的な記憶を行なうこ
とができる、優れたロボット装置及びその制御方法、人
工エージェント、記憶制御装置及び記憶制御方法を提供
することにある。
【0019】
【課題を解決するための手段及び作用】本発明は、上記
課題を参酌してなされたものであり、その第1の側面
は、関節駆動又はユーザとの対話駆動を行う駆動部と、
入力されたパターンを所定の学習率で記憶する記憶部
と、前記記憶部における学習率を変化させる記憶能力制
御部と、前記記憶部により記憶されたパターンを想起し
て前記駆動部による機体動作を制御する行動制御部と、
を具備することを特徴とするロボット装置である。
【0020】また、本発明の第2の側面は、関節駆動又
はユーザとの対話駆動を行うロボット装置の制御方法で
あって、入力されたパターンを所定の学習率で記憶する
記憶ステップと、前記記憶部における学習率を変化させ
る記憶能力制御ステップと、前記記憶部により記憶され
たパターンを想起して前記ロボット装置の機体動作を制
御する行動制御ステップと、を具備することを特徴とす
るロボット装置の制御方法である。
【0021】ここで言う前記学習率とは、パターンが提
示された回数と記憶の関係を表すパラメータのことであ
る。
【0022】本発明の第1又は第2の側面に係るロボッ
ト装置又はその制御方法によれば、記憶能力に変化を持
たせることによって、よりリアルでユーザに飽きさせな
いインタラクションを行なうことができる。
【0023】ロボット装置の記憶メカニズムとしては、
入力パターンに応じて発火する複数の入力ニューロンか
らなる入力層と、各入力ニューロンからの出力を結合力
に応じて重み付け入力する複数の競合ニューロンからな
る競合層とを備えた競合型ニューラル・ネットワークを
適用することができる。
【0024】このような競合型ニューラル・ネットワー
クにおいては、ある入力パターンに対して各入力ニュー
ロンからの重み付け入力値の総和が最大となる競合ニュ
ーロンを選択して、該競合ニューロンと各入力ニューロ
ーンとの結合力を強めることによって、該入力パターン
の記憶を強化する、すなわち学習することができる。ま
た、一部が欠損した入力パターンに対して各入力ニュー
ロンからの重み付け入力値の総和が最大となる競合ニュ
ーロンを選択して、該競合ニューロンと結合力の強い入
力ニューローンからなる記憶パターンを想起することが
できる。
【0025】このような競合型ニューラル・ネットワー
クで構成された記憶メカニズムにおいては、学習率と
は、パターンが提示された回数に応じて競合ニューロン
と各入力ニューローンとの結合力を強める度合いを表す
パラメータに相当する。したがって、記憶能力制御部又
はステップは、競合に勝ち抜いた出力ニューロンと各入
力ニューロンとの結合の更新を行う際に、学習率変更要
素のデータを収集して、現在の状態での学習率を算出す
るようにすればよい。
【0026】前記記憶能力制御部又はステップは、例え
ば、前記ロボット装置の成長時間に応じて学習率を変化
させるようにしてもよい。より具体的に言えば、生まれ
たときの学習率を高い値に設定するとともに所定の基準
時間に近づくにつれて学習率を低下させていくようにし
てもよい。
【0027】このような場合、ロボット装置は、幼少期
においては、ユーザとのインタラクションで利用した物
体情報や経験知識を「人の幼少期」と同じようにすぐに
記憶することができる。また、成熟期になったときに
は、「人の成熟期」と同じように人工エージェントの経
験を最大限に活かしたことを表出させたいと考え、記憶
データの更新は頻発しない。したがって、ロボット装置
は、「人と同じような」成長を、ユーザに飽きさせない
ほど充分に模倣することが可能となる。
【0028】また、前記記憶能力制御部又はステップ
は、記憶の確からしさに応じて学習率を変化させるよう
にしてもよい。例えば、競合型ニューラル・ネットワー
クにより記憶メカニズムが構成される場合には、競合に
勝ち抜いた出力ニューロンの発火値とそれ以外の出力ニ
ューロンの発火値との偏差に応じて学習率を変化させる
ようにすればよい。
【0029】より具体的に言えば、いままでまったく学
習したことがないようなデータを学習しようとしたとき
は、各出力ニューロン間で発火値の偏差が小さいので学
習率を小さくする一方、何度か学習が行われたようなデ
ータを学習するときは、次第に各出力ニューロン間で発
火値の偏差が大きくなるので学習率も大きくする。
【0030】このような場合、ノイズであるかも知れな
いデータは強く学習せず、ノイズデータでないことを確
認できたときに強く学習するという効果を持つ。ロボッ
ト装置は、ノイズのようなデータは強く覚えることはな
くなり、記憶情報の混乱を起こす可能性が低くなる。
【0031】また、さらに何度も学習したようなデータ
を学習しようとしたときには、再び学習率αを小さくし
て、弱く学習するようにしてもよい。既に強く学習がな
されているデータは、あまり覚える必要がなく、逆に強
く学習してしまうことよって他の重要な学習データを弱
めてしまうことになるからである。
【0032】また、前記記憶能力制御部又はステップ
は、前記ロボット装置の本能に応じて学習率を変化させ
るようにしてもよい。
【0033】このような場合、学習率αを本能Iの関数
α(I)として定義すればよい。例えば、空腹の度合い
が進行するにつれて学習率αを小さくすることにより、
記憶能力が落ち込んでいく。逆に空腹が解消されるにつ
れて集中力が増すので学習率αを大きくすることにより
記憶能力を向上させるが、満腹に近づくにつれて学習率
をやがて低下させ始めて、記憶能力を低下させる。この
ような記憶能力の変動は、生命体に類似するものであ
る。
【0034】また、前記記憶能力制御部又はステップ
は、前記ロボット装置の感情に応じて学習率を変化させ
るようにしてもよい。
【0035】このような場合、学習率αを感情eの関数
α(e)として定義すればよい。例えば、つまらない状
態では退屈のため学習率αを小さくすることにより、記
憶能力が落ち込んでいく。逆に、楽しい状態では物事を
受け容れ易くなり学習率αを大きくすることにより、記
憶能力を向上させる。このような記憶能力の変動は、生
命体に類似するものである。
【0036】また、前記記憶能力制御部又はステップ
は、1日のうちの時間帯に応じて学習率を変化させるよ
うにしてもよい。
【0037】このような場合、学習率αを時刻又はスケ
ジュールsの関数α(s)として定義すればよい。例え
ば、朝起きたばかりの状態ではまだ眠いため学習率αを
小さくすることにより、記憶能力を低下させる。そし
て、朝食をとった後では、空腹感が癒されるとともに目
が覚めてくることにより集中力が高まるので、学習率α
を大きくすることにより、記憶能力を向上させる。ま
た、昼食後など眠い時間帯にかかると、集中力が低下し
てくるので、学習率αを小さくすることにより、記憶能
力を低下させる。また、就寝する時間帯になると、睡魔
のために学習率を小さくすることにより、記憶能力を低
下させる。このような記憶能力の変動は、生命体に類似
するものである。
【0038】また、前記記憶能力制御部又はステップ
は、前記ロボット装置が遭遇する場面に応じて学習率を
変化させるようにしてもよい。
【0039】このような場合、学習率αを遭遇する場面
lの関数α(l)として定義すればよい。例えば、学校
にいるときなど窮屈な状態では気分が乗らないため学習
率αを小さくすることにより、記憶能力が落ち込んでい
く。逆に、家や畑にいるときなどリラックスしている状
態では物事を受け容れ易くなり学習率αを大きくするこ
とにより、記憶能力を向上させる。このような記憶能力
の変動は、生命体に類似するものである。
【0040】本発明のさらに他の目的、特徴や利点は、
後述する本発明の実施形態や添付する図面に基づくより
詳細な説明によって明らかになるであろう。
【0041】
【発明の実施の形態】以下、図面を参照しながら本発明
の実施形態について詳解する。
【0042】A.ロボット装置の構成 図1には、本発明に実施に供されるロボット装置1の機
能構成を模式的に示している。同図に示すように、ロボ
ット装置1は、全体の動作の統括的制御やその他のデー
タ処理を行う制御ユニット20と、入出力部40と、駆
動部50と、電源部60とで構成される。以下、各部に
ついて説明する。
【0043】入出力部40は、入力部としてロボット装
置1の目に相当するCCDカメラ15や、耳に相当する
マイクロフォン16、頭部や背中などの部位に配設され
てユーザの接触を感知するタッチ・センサ18、各足底
に配設された肉球スイッチ(図示しない)、あるいは五
感に相当するその他の各種のセンサを含む。また、出力
部として、口に相当するスピーカ17、あるいは点滅の
組み合わせや点灯のタイミングにより顔の表情を形成す
るLEDインジケータ(目ランプ)19などを装備して
いる。これら出力部は、音声やランプの点滅など、脚な
どによる機械運動パターン以外の形式でもロボット装置
1からのユーザ・フィードバックを表現することができ
る。
【0044】駆動部50は、制御部20が指令する所定
の運動パターンに従ってロボット装置1の機体動作を実
現する機能ブロックであり、行動制御による制御対象で
ある。駆動部50は、ロボット装置1の各関節における
自由度を実現するための機能モジュールであり、それぞ
れの関節におけるロール、ピッチ、ヨーなど各軸毎に設
けられた複数の駆動ユニットで構成される。各駆動ユニ
ットは、所定軸回りの回転動作を行うモータ51と、モ
ータ51の回転位置を検出するエンコーダ52と、エン
コーダ52の出力に基づいてモータ51の回転位置や回
転速度を適応的に制御するドライバ53の組み合わせで
構成される。
【0045】駆動ユニットの組み合わせ方によって、ロ
ボット装置1を例えば2足歩行又は4足歩行などの脚式
移動ロボットとして構成することができる。
【0046】電源部60は、その字義通り、ロボット装
置1内の各電気回路などに対して給電を行う機能モジュ
ールである。本実施形態に係るロボット装置1は、バッ
テリを用いた自律駆動式であり、電源部60は、充電バ
ッテリ61と、充電バッテリ61の充放電状態を管理す
る充放電制御部62とで構成される。
【0047】充電バッテリ61は、例えば、複数本のニ
ッケル・カドミウム電池セルをカートリッジ式にパッケ
ージ化した「バッテリ・パック」の形態で構成される。
【0048】また、充放電制御部62は、バッテリ61
の端子電圧や充電/放電電流量、バッテリ61の周囲温
度などを測定することでバッテリ61の残存容量を把握
し、充電の開始時期や終了時期などを決定する。充放電
制御部62が決定する充電の開始及び終了時期は制御ユ
ニット20に通知され、ロボット装置1が充電オペレー
ションを開始及び終了するためのトリガとなる。
【0049】制御ユニット20は、「頭脳」に相当し、
例えばロボット装置1の機体頭部あるいは胴体部に搭載
されている。
【0050】図2には、制御ユニット20の構成をさら
に詳細に図解している。同図に示すように、制御ユニッ
ト20は、メイン・コントローラとしてのCPU(Cent
ralProcessing Unit)21が、メモリやその他の各回路
コンポーネントや周辺機器とバス接続された構成となっ
ている。バス27は、データ・バス、アドレス・バス、コ
ントロール・バスなどを含む共通信号伝送路である。バ
ス27上の各装置にはそれぞれに固有のアドレス(メモ
リ・アドレス又はI/Oアドレス)が割り当てられてい
る。CPU21は、アドレスを指定することによってバ
ス28上の特定の装置と通信することができる。
【0051】RAM(Random Access Memory)22は、
DRAM(Dynamic RAM)などの揮発性メモリで構成さ
れた書き込み可能メモリであり、CPU21が実行する
プログラム・コードをロードしたり、実行プログラムに
よる作業データの一時的な保存のために使用される。
【0052】ROM(Read Only Memory)23は、プロ
グラムやデータを恒久的に格納する読み出し専用メモリ
である。ROM23に格納されるプログラム・コードに
は、ロボット装置1の電源投入時に実行する自己診断テ
スト・プログラムや、ロボット装置1の動作を規定する
動作制御プログラムなどが挙げられる。
【0053】ロボット装置1の制御プログラムには、カ
メラ15やマイクロフォン16などのセンサ入力を処理
してシンボルとして認識する「センサ入力・認識処理プ
ログラム」、短期記憶や長期記憶などの記憶動作(後
述)を司りながらセンサ入力と所定の行動制御モデルと
に基づいてロボット装置1の行動を制御する「行動制御
プログラム」、行動制御モデルに従って各関節モータの
駆動やスピーカ17の音声出力などを制御する「駆動制
御プログラム」などが含まれる。
【0054】不揮発性メモリ24は、例えばEEPRO
M(Electrically Erasable and Programmable ROM)の
ように電気的に消去再書き込みが可能なメモリ素子で構
成され、逐次更新すべきデータを不揮発的に保持するた
めに使用される。逐次更新すべきデータには、暗号鍵や
その他のセキュリティ情報、出荷後にインストールすべ
き装置制御プログラムなどが挙げられる。
【0055】インターフェース25は、制御ユニット2
0外の機器と相互接続し、データ交換を可能にするため
の装置である。インターフェース25は、例えば、カメ
ラ15やマイクロフォン16、スピーカ17との間でデ
ータ入出力を行う。また、インターフェース25は、駆
動部50内の各ドライバ53−1…との間でデータやコ
マンドの入出力を行う。
【0056】また、インターフェース25は、RS(Re
commended Standard)−232Cなどのシリアル・イン
ターフェース、IEEE(Institute of Electrical an
d electronics Engineers)1284などのパラレル・
インターフェース、USB(Universal Serial Bus)イ
ンターフェース、i−Link(IEEE1394)イ
ンターフェース、SCSI(Small Computer System In
terface)インターフェース、メモリ・スティックを受
容するメモリ・カード・インターフェース(カード・ス
ロット)などのような、コンピュータの周辺機器接続用
の汎用インターフェースを備え、ローカル接続された外
部機器との間でプログラムやデータの移動を行うように
してもよい。
【0057】また、インターフェース25の他の例とし
て、赤外線通信(IrDA)インターフェースを備え、
外部機器と無線通信を行うようにしてもよい。
【0058】さらに、制御ユニット20は、無線通信イ
ンターフェース26やネットワーク・インターフェース
・カード(NIC)27などを含み、Bluetoot
hのような近接無線データ通信や、IEEE 802.
11bのような無線ネットワーク、あるいはインターネ
ットなどの広域ネットワークを経由して、外部のさまざ
まなホスト・コンピュータとデータ通信を行うことがで
きる。
【0059】このようなロボット装置1とホスト・コン
ピュータ間におけるデータ通信により、遠隔のコンピュ
ータ資源を用いて、ロボット装置1の複雑な動作制御を
演算したり、リモート・コントロールすることができ
る。
【0060】B.ロボット装置の行動制御システム 図3には、本発明の実施形態に係るロボット装置1の行
動制御システム100の機能構成を模式的に示してい
る。ロボット装置1は、外部刺激から内部状態の変化を
連想記憶することにより、外部刺激の認識結果や内部状
態の変化に応じて行動制御を行うことができる。
【0061】図示の行動制御システム100にはオブジ
ェクト指向プログラミングを採り入れて実装することが
できる。この場合、各ソフトウェアは、データとそのデ
ータに対する処理手続きとを一体化させた「オブジェク
ト」というモジュール単位で扱われる。また、各オブジ
ェクトは、メッセージ通信と共有メモリを使ったオブジ
ェクト間通信方法によりデータの受け渡しとInvok
eを行なうことができる。
【0062】行動制御システム100は、外部環境(E
nvironments)を認識するために、視覚認識
機能部101と、聴覚認識機能部102と、接触認識機
能部103を備えている。
【0063】視覚認識機能部(Video)51は、例
えば、CCD(Charge Coupled Device:電荷結合素
子)カメラ15のような画像入力装置を介して入力され
た撮影画像を基に、顔認識や色認識などの画像認識処理
や特徴抽出を行ない、顔や色、形などの物体に対する視
覚的な認識結果に相当するシンボルをIDとして出力す
る。
【0064】聴覚認識機能部(Audio)102は、
マイク16などの音声入力装置を介して入力される音声
データを音声認識して、特徴抽出したり、単語セット
(テキスト)認識を行ったりして、入力音声の認識結果
に相当するシンボルをIDとして出力する。
【0065】接触認識機能部(Tactile)103
は、例えば機体の頭部などに内蔵された接触センサによ
るセンサ信号を認識して、「なでられた」とか「叩かれ
た」という外部刺激を認識して、触感に関する認識結果
に相当するシンボルをIDとして出力する。
【0066】内部状態管理部(ISM:Internal Statu
s Manager)104は、本能モデルや感情モデルを備
え、上述の視覚認識機能部101と、聴覚認識機能部1
02と、接触認識機能部103によって認識された外部
刺激(ES:ExternalStimula)に応じ
てロボット装置1の本能や情動といった内部状態を管理
する。
【0067】感情モデルと本能モデルは、それぞれ認識
結果と行動履歴を入力に持ち、感情値と本能値を管理し
ている。行動モデルは、これら感情値や本能値を参照す
ることができる。
【0068】本実施形態に係るロボット装置1は、外部
刺激の認識結果や内部状態の変化に応じて行動制御を行
なうために、時間の経過とともに失われる短期的な記憶
を行なう短期記憶部105と、情報を比較的長期間保持
するための長期記憶部106を備えている。
【0069】短期記憶部(ShortTermMemo
ry)105は、上述の視覚認識機能部101と、聴覚
認識機能部102と、接触認識機能部103によって外
部環境から認識されたターゲットやイベントを短期間保
持する機能モジュールである。例えば、カメラ15から
の入力画像を約15秒程度の短い期間だけ記憶する。
【0070】長期記憶部(LongTermMemor
y)106は、物の名前など学習により得られた情報を
長期間保持するために使用される。長期記憶部106
は、例えば、ある行動モジュールにおいて外部刺激から
内部状態の変化を連想記憶(後述)することができる。
【0071】短期記憶と長期記憶という記憶メカニズム
の分類は神経心理学に依拠するが、詳細は後述に譲る。
【0072】また、本実施形態に係るロボット装置1の
行動制御は、反射行動部109によって実現される「反
射行動」と、状況依存行動階層108によって実現され
る「状況依存行動」と、熟考行動階層107によって実
現される「熟考行動」に大別される。
【0073】反射的行動部(Configuratio
nDependentActionsAndReact
ions)109は、上述の視覚認識機能部101と、
聴覚認識機能部102と、接触認識機能部103によっ
て認識された外部刺激に応じて反射的な機体動作を実現
する機能モジュールである。
【0074】反射行動とは、基本的に、センサ入力され
た外部情報の認識結果を直接受けて、これを分類して、
出力行動を直接決定する行動のことである。例えば、人
間の顔を追いかけたり、うなずくといった振る舞いは反
射行動として実装することが好ましい。
【0075】状況依存行動階層(SituatedBe
haviorsLayer)108は、短期記憶部10
5並びに長期記憶部106の記憶内容や、内部状態管理
部104によって管理される内部状態を基に、ロボット
装置1が現在置かれている状況に即応した行動を制御す
る。
【0076】状況依存行動階層108は、各行動毎にス
テートマシンを用意しており、それ以前の行動や状況に
依存して、センサ入力された外部情報の認識結果を分類
して、行動を機体上で発現する。また、状況依存行動階
層108は、内部状態をある範囲に保つための行動
(「ホメオスタシス行動」とも呼ぶ)も実現し、内部状
態が指定した範囲内を越えた場合には、その内部状態を
当該範囲内に戻すための行動が出易くなるようにその行
動を活性化させる(実際には、内部状態と外部環境の両
方を考慮した形で行動が選択される)。状況依存行動
は、反射行動に比し、反応時間が遅い。
【0077】熟考行動階層(Deliberative
Layer)107は、短期記憶部105並びに長期記
憶部106の記憶内容に基づいて、ロボット装置1の比
較的長期にわたる行動計画などを行う。
【0078】熟考行動とは、与えられた状況あるいは人
間からの命令により、推論やそれを実現するための計画
を立てて行われる行動のことである。このような推論や
計画は、ロボット装置1がインタラクションを保つため
の反応時間よりも処理時間や計算負荷を要する可能性が
あるので、上記の反射行動や状況依存行動がリアルタイ
ムで反応を返しながら、熟考行動は推論や計画を行う。
【0079】C.ロボット装置の記憶メカニズム 上述したように、本実施形態に係るロボット装置1は、
短期記憶部105と長期記憶部106を備えているが、
このような記憶メカニズムは、神経心理学に依拠する。
【0080】短期記憶は、字義通り短期的な記憶であ
り、時間の経過とともに失われる。短期記憶は、例え
ば、視覚や聴覚、接触など、外部環境から認識されたタ
ーゲットやイベントを短期間保持するために使用するこ
とができる。
【0081】また、長期記憶は、物の名前など学習によ
り得られた情報を長期間保持するために使用される。同
じパターンを統計的に処理して、ロバストな記憶にする
ことができる。本実施形態に係る長期記憶は、競合型ニ
ューラル・ネットワークを用いた連想記憶モデルを用い
て実現されている。
【0082】ここで、連想記憶とは、あらかじめ複数の
シンボルからなる入力パターンを記憶パターンとして記
憶しておき、その中のある1つのパターンに類似したパ
ターンが想起される仕組みのことを言う。連想記憶によ
れば、一部欠陥のあるパターンが入力されたとき、記憶
されている複数のパターンの中で最も近い記憶パターン
を出力することができる。これは、不完全なデータから
なる外部刺激しか与えられなかったときであっても、該
当するニューロンの発火によりあるオブジェクトの意味
などを想起することができるからである。
【0083】連想記憶は、「自己想起型連想記憶」と
「相互想起型連想記憶」に大別される。自己想起型とは
記憶したパターンを直接キー・パターンで引き出すモデ
ルであり、また、相互想起型とは入力パターンと出力パ
ターンがある種の連合関係で結ばれているモデルであ
る。
【0084】本実施形態では、自己想起型連想記憶を採
用するが、これは、従来のホップフィールドやアソシア
トロン(前述)などの記憶モデルに比し、追加学習が容
易である、入力パターンの統計的な記憶が可能である、
などのメリットがある。追加学習によれば、新しいパタ
ーンを新たに記憶しても、過去の記憶が上書きされて消
されることはない。また、統計的な学習によれば、同じ
ものを多く見ればそれだけ記憶に残るし、また同じこと
を繰り返し実行すれば、忘れにくくなる。この場合、記
憶過程において、毎回完全なパターンが入力されなくと
も、繰り返し実行により、多く提示されたパターンに収
束していく。
【0085】C−1.連想記憶メカニズム この項では、競合型ニューラル・ネットワークを用いた
連想記憶メカニズムについて説明する。
【0086】ロボット装置1が覚えるパターンは、ロボ
ット装置1への外部刺激と内部状態の組み合わせで構成
される。
【0087】ここで、外的刺激とは、ロボット装置1が
センサ入力を認識して得られた知覚情報であり、例え
ば、カメラ15から入力された画像に対して処理された
色情報、形情報、顔情報などであり、より具体的には、
色、形、顔、3D一般物体、ハンドジェスチャー、動
き、音声、接触、匂い、味などの構成要素からなる。
る。
【0088】また、内的状態とは、例えば、ロボットの
身体に基づいた本能や情動を指す。本能的要素は、例え
ば、疲れ(fatigue)、熱或いは体内温度(temperatur
e)、痛み(pain)、食欲或いは飢え(hunger)、乾き
(thirst)、愛情(affection)、好奇心(curiosit
y)、排泄(elimination)又は性欲(sexual)のうちの
少なくとも1つである。また、情動的要素は、幸せ(ha
ppiness)、悲しみ(sadness)、怒り(anger)、驚き
(surprise)、嫌悪(disgust)、恐れ(fear)、苛立
ち(frustration)、退屈(boredom)、睡眠(somnolen
ce)、社交性(gregariousness)、根気(patience)、
緊張(tense)、リラックス(relaxed)、警戒(alertn
ess)、罪(guilt)、悪意(spite)、誠実さ(loyalt
y)、服従性(submission)又は嫉妬(jealousy)のう
ちの少なくとも1つである。
【0089】本実施形態に係る競合型ニューラル・ネッ
トワークを適用した連想記憶メカニズムでは、これら外
部刺激や内部状態を構成する各要素に対して入力チャン
ネルを割り当てている。また、視覚認識機能部101や
聴覚認識機能部102などの各知覚機能モジュールは、
センサ出力となる生の信号を送るのではなく、センサ出
力を認識した結果をシンボル化して、シンボルに相当す
るID情報(例えば、色プロトタイプID、形プロトタ
イプID、音声プロトタイプIDなど)を該当するチャ
ンネルに送るようになっている。
【0090】例えば、カラー・セグメンテーション・モ
ジュールによりセグメンテーションされた各オブジェク
トは、色プロトタイプIDを付加されて連想記憶システ
ムに入力される。また、顔認識モジュールにより認識さ
れた顔のIDが連想記憶システムに入力される。また、
物体認識モジュールにより認識された物体のIDが連想
システムに入力される。また、音声認識モジュールから
は、ユーザの発話により単語のプロトタイプIDが入力
される。このとき、発話の音素記号列(Phoneme Sequen
ce)も入力されるので、記憶・連想の処理で、ロボット
装置1に発話させることが可能となる。また、本能に関
しては、アナログ値を扱えるようになっており(後
述)、例えば、本能のデルタ値を80で記憶しておけ
ば、連想により80というアナログ値を得ることが可能
である。
【0091】したがって、競合型ニューラル・ネットワ
ークを適用した連想記憶システムは、色、形、音声…な
どの外部刺激や内部状態を、各チャンネル毎のシンボル
化されたIDの組み合わせからなる入力パターンとして
記憶することができる。すなわち、連想記憶システムが
記憶するのは、[色ID 形ID 顔ID 音声ID…
本能ID(値) 情動 ID]の組み合わせである。
【0092】連想記憶には、記憶過程と想起過程があ
る。図4には、連想記憶の記憶過程の概念を示してい
る。
【0093】連想記憶システムに入力される記憶パター
ンは、外部刺激や内部状態の各要素毎に割り当てられて
いる複数のチャンネルで構成される(図示の例では入力
1〜入力8の8チャンネルからなる)。そして、各チャ
ンネルには、対応する外部刺激の認識結果や内部状態を
シンボル化したID情報が送られてくる。図示の例で
は、各チャンネルの濃淡がID情報を表しているものと
する。例えば、記憶パターン中のk番目のカラムが顔の
チャンネルに割り当てられている場合、その色により顔
のプロトタイプIDを表している。
【0094】図4に示す例では、連想記憶システムは既
に1〜nの合計n個の記憶パターンを記憶しているもの
とする。ここで、2つの記憶パターン間での対応するチ
ャンネルの色の相違は、同じチャンネル上で記憶してい
る外部刺激又は内部状態のシンボルすなわちIDが当該
記憶パターン間で異なることを意味する。
【0095】また、図5には、連想記憶の想起過程の概
念を示している。上述したように、記憶過程で蓄えた入
力パターンに似たパターンが入力されると、欠落してい
た情報を補うように完全な記憶パターンが出力される。
【0096】図5に示す例では、8チャンネルからなる
記憶パターンのうち上位の3チャンネルしかIDが与え
られていないパターンがキー・パターンとして入力され
る。このような場合、連想記憶システムでは、既に貯え
られている記憶パターンの中で、これら上位の3チャン
ネルが最も近いパターン(図示の例では記憶パターン
1)を見つけ出して、想起されたパターンとして出力す
ることができる。すなわち、欠落していたチャンネル4
〜8の情報を補うように、最も近い記憶パターンが出力
される。
【0097】したがって、連想記憶システムによれば、
顔のIDのみから音声ID、つまり名前を連想したり、
食べ物の名前だけから、“おいしい”や“おいしくな
い”などを想起することができる。
【0098】C−2.競合型ニューラル・ネットワーク
による連想記憶の詳細 図6には、競合型ニューラル・ネットワークを適用した
連想記憶システムの構成例を模式的に示している。同図
に示すように、この競合型ニューラル・ネットワーク
は、入力層(input layer)と競合層(competitive lay
er)の2層からなる階層型ニューラル・ネットワークで
ある。
【0099】この競合型ニューラル・ネットワークは、
記憶モードと連想モードという2通りの動作モードを備
えており、記憶モードでは入力パターンを競合的に記憶
し、また、想起モードでは部分的に欠損した入力パター
ンから完全な記憶パターンを想起する。
【0100】入力層は、複数の入力ニューロンで構成さ
れる。各入力ニューロンには、外部刺激や内部状態を表
す各要素に対して割り当てられたチャンネルから、外部
刺激や内部状態の認識結果に相当するシンボルすなわち
ID情報が入力される。入力層では、色IDの個数+形
IDの個数+音声IDの個数+本能の種類…に相当する
個数のニューロンを用意する必要がある。
【0101】また、競合層は、複数の競合ニューロンで
構成される。各競合ニューロンは、入力層側の各入力ニ
ューロンとは、ある結合重みを持って結合されている。
競合ニューロンは、それぞれのニューロンが記憶すべき
1つのシンボルに相当する。言い換えれば、競合ニュー
ロンの数は記憶可能なシンボルの個数に相当する。
【0102】C−2−1.記憶モード 入力層と競合層の結合重みは、0から1の間の値をとる
ものとする。但し、初期結合重みはランダムに決定す
る。
【0103】競合型ニューラル・ネットワークにおける
記憶は、まず、記憶したい入力パターンに対して競合層
で勝ち抜いた競合ニューロンを選択して、その競合ニュ
ーロンと各入力ニューロンとの結合力を強めることで行
なう。
【0104】ここで、入力パターン・ベクトル[x1
2,…,xn]は、ニューロンが、色プロトタイプID
1に対応し、ID1が認識されたら、ニューロンx1
発火させ、順次、形、音声もそのように発火させること
とする。発火したニューロンは1の値をとり、発火しな
いニューロンは−1の値をとる。
【0105】また、i番目の入力ニューロンとj番目の
競合ニューロンとの結合力をwijとおくと、入力xi
対する競合ニューロンyjの値は、下式のように表され
る。
【0106】
【数1】
【0107】したがって、競合に勝ち抜くニューロン
は、下式により求めることができる。
【0108】
【数2】
【0109】記憶は、競合層で勝ち抜いた競合ニューロ
ン(winner neuron)と各入力ニューロンとの結合力を
強めることで行なう。勝ち抜いたニューロン(winner n
euron)と入力ニューロンとの結合wijの更新は、Ko
honenの更新規則により、以下のように行なわれ
る。
【0110】
【数3】
【0111】ここで、L2Normで正規化する。
【0112】
【数4】
【0113】この結合力がいわゆる記憶の強さを表し、
記憶力になる。
【0114】ここで、学習率αは、提示する回数と記憶
の関係を表すパラメータである。学習率αが大きいほ
ど、1回の記憶で重みを大きく変更する。例えば、α=
0.5を用いると、一度記憶させれば、忘却することは
なく、次回同じようなパターンを提示すれば、ほぼ間違
いなく記憶したパターンを連想することができる。
【0115】C−2−2.想起モード いま、以下に示すような入力パターン・ベクトルが図6
に示す連想記憶システムに提示されたとする。入力パタ
ーンは、完全なものではなく一部が欠損していてもよ
い。
【0116】
【数5】
【0117】このとき、入力ベクトルは、プロトタイプ
IDであっても、あるいはそのプロトタイプIDに対す
る尤度、確率であってもよい。出力ニューロンyjの値
は、入力xiについて下式のように計算される。
【0118】
【数6】
【0119】上式は、各チャンネルの尤度に応じた競合
ニューロンの発火値の尤度を表しているとも言える。こ
こで重要なことは、複数のチャンネルからの尤度入力に
対して、それらをコネクションして全体的な尤度を求め
ることが可能である、という点である。本実施形態で
は、連想するものは唯一すなわち尤度が最大のものだけ
を選択することとし、競合に勝ち抜くニューロンを下式
により求めることができる。
【0120】
【数7】
【0121】求めた競合ニューロンYの番号が記憶した
シンボルの番号に対応するので、下式のように、Wの逆
行列演算により入力パターンXを想起することができ
る。
【0122】
【数8】
【0123】C−3.記憶能力の制御 本発明は、ロボット装置やその他の人工エージェントな
ど、記憶機能を用いてユーザとのインタラクションを実
現するシステムにおいて、記憶能力に変化を持たせて、
よりリアルでユーザに飽きさせないインタラクションを
行なうものである。より具体的には、生命体の成長の度
合いや情報の確信度、あるいは人工エージェントのその
他の内部状態などに応じて記憶能力を動的に変更して、
擬似生命体らしく、効率的な記憶を行なう。
【0124】図6に示したような競合型ニューラル・ネ
ットワークを適用した連想記憶システムにおいては、学
習率αを変化させるによって記憶能力を制御することが
できる。
【0125】学習率αは、提示する回数と記憶の関係を
表すパラメータである。学習率αが大きいほど、1回の
記憶で重みを大きく変更する。例えば、α=0.5を用
いると、一度記憶させれば、忘却することはなく、次回
同じようなパターンを提示すれば、ほぼ間違いなく記憶
したパターンを連想することができる。
【0126】C−3−1.成長時間に応じた記憶能力の
制御 学習率αを、下式に示すように、成長時間tに応じて変
化する関数として扱うことにより、成長過程に応じて記
憶能力を動的に変化させることができる。
【0127】
【数9】
【0128】成長過程に応じた学習率αの変化として、
成長するに従って徐々に学習率が衰えていくという例が
考えられる。例えば、下式α(t)を用いることによっ
て、生まれたばかりのときの記憶能力αはαmaxで表さ
れる高い値を示すが、ある基準時間τが近づくにつれ徐
々に記憶能力は衰え始め、最終的にはαminで表される
低い値を示すようになる。このような学習率の変動作用
は、下式α(t)にsigmoid関数を含めることに
よって実現される。
【0129】
【数10】
【0130】図7には、成長時間tに応じて記憶能力を
制御するための記憶能力制御システム200の機能構成
を模式的に示している。同図に示すように、記憶能力制
御システム200は、入力部201と、強化シンボル特
定部202と、強化度計算部203と、記憶更新部20
4とで構成される。
【0131】入力部201は、新規の記憶データを入力
する。記憶データは、外部刺激や内部状態の各要素毎に
割り当てられている複数のチャンネルで構成される入力
パターン[x1,x2,…,xn]であり、各チャンネル
には対応する外部刺激の認識結果や内部状態をシンボル
化したID情報が送られてくる。
【0132】強化シンボル特定部202は、入力層と競
合層の2層からなる競合型ニューラル・ネットワーク
(図6を参照のこと)を備えている。入力部201から
入力パターン[x1,x2,…,xn]が入力されると、
各出力ニューロンにおける発火値を上記の[数1]を用
いて計算する。そして、出力層のニューロンの中から最
も発火値が大きいニューロンを競合に勝ち抜いたものと
して選択する。
【0133】また、強化度計算部203では、学習率変
更要素のデータを収集して、現在の状態での学習率αを
算出する。ここでは、学習率変更要素は、ロボット装置
1(又は人工エージェント)の成長時間tであり、学習
率αは例えば上記の[数10]により計算することがで
きる。
【0134】記憶更新部204は、強化シンボル特定部
202において選択された出力ニューロンと入力層の各
ニューロンとの結合を、強化度計算部203により計算
された学習率αを利用して更新する。勝ち抜いたニュー
ロンと入力ニューロンとの結合wijの更新は、Koho
nenの更新規則により、上記の[数3]で示した式に
より行なわれる。
【0135】上記の式[数10]に従って学習率αを更
新する、すなわちロボット装置1の記憶能力を制御する
ことによって、ロボット装置1は、幼少期においては、
ユーザとのインタラクションで利用した物体情報や経験
知識を「人の幼少期」と同じようにすぐに記憶すること
ができる。また、成熟期になったときには、「人の成熟
期」と同じように人工エージェントの経験を最大限に活
かしたことを表出させたいと考え、記憶データの更新は
頻発しない。したがって、ロボット装置1は、「人と同
じような」成長を、ユーザに飽きさせないほど充分に模
倣することが可能となる。
【0136】C−3−2.記憶の確からしさに応じた記
憶能力の制御 一般に、確信が持てないような情報をあまり強く記憶す
る必要はない。むしろ、確信度の如何に拘わらず一様に
情報を記憶すると、記憶情報の混乱を招きかねない。
【0137】他方、上述した競合型ニューラル・ネット
ワークにおいては、ある入力パターンを入力したときの
競合層の各出力ニューロンの発火値yiは、max
{yi}すなわち競合に勝ち抜いた出力ニューロンを求
めることにより、正しいシンボル番号すなわち記憶パタ
ーンを検索するために利用される。
【0138】ここで、各出力ニューロンにおける発火値
kは、ニューロンの記憶の確信度に相当する。競合に
勝ち抜いた出力ニューロンの発火値max{yi}と他
の出力ニューロンの発火値ykとの差が大きければ多い
ほど(すなわち発火値の偏差が大きいほど)、その記憶
の確からしさが高いということになる。逆に、この差
(発火値の偏差)が小さければ、各出力ニューロンにお
ける記憶の確信度の相違はあいまいとなり、記憶の確か
らしさが低いことになる。したがって、競合に勝ち抜い
た出力ニューロンの発火値max{yi}と他の出力ニ
ューロンの発火値ykとの差の度合いを記憶の確からし
さを表す指標とすることができる。
【0139】本実施形態では、新しく学習しようとして
いるデータが実際に学習すべきデータであるかどうか
を、その記憶の確信度に基づいて判断するようにしてい
る。そして、記憶の確からしさに応じた学習率αで学習
することを実現するために、学習率αを発火値yiすな
わち記憶の確信度の分散σ2の関数として定義する。
【0140】
【数11】
【0141】ここで、記憶の確信度の分散σ2は、下式
により求めることができる。
【0142】
【数12】
【0143】図8には、記憶の確信度σ2に応じて記憶
能力を制御するための記憶能力制御システム200−2
の機能構成を模式的に示している。同図に示すように、
記憶能力制御システム200−2は、入力部201と、
強化シンボル特定部202と、強化度計算部203と、
記憶更新部204とで構成される。
【0144】入力部201は、新規の記憶データを入力
する。記憶データは、外部刺激や内部状態の各要素毎に
割り当てられている複数のチャンネルで構成される入力
パターン[x1,x2,…,xn]であり、各チャンネル
には対応する外部刺激の認識結果や内部状態をシンボル
化したID情報が送られてくる。
【0145】強化シンボル特定部202は、入力層と競
合層の2層からなる競合型ニューラル・ネットワーク
(図6を参照のこと)を備えている。入力部201から
入力パターン[x1,x2,…,xn]が入力されると、
各出力ニューロンにおける発火値を上記の[数1]を用
いて計算する。そして、出力層のニューロンの中から最
も発火値が大きいニューロンを競合に勝ち抜いたものと
して選択する。
【0146】また、強化度計算部203では、競合型ニ
ューラル・ネットワークにおける記憶の確信度σ2を計
算して([数13]を参照のこと)、さらにこの記憶の
確信度σ2を用いて現在の状態での学習率αを算出する
([数12]を参照のこと)。
【0147】記憶更新部204は、強化シンボル特定部
202において選択された出力ニューロンと入力層の各
ニューロンとの結合を、強化度計算部203により計算
された学習率αを利用して更新する。勝ち抜いたニュー
ロンと入力ニューロンとの結合wijの更新は、Koho
nenの更新規則により、上記の[数3]で示した式に
より行なわれる。
【0148】このような記憶の確信度σ2に基づいた学
習率αの制御として、図9にようなものが考えられる。
【0149】いままでまったく学習したことがないよう
なデータを学習しようとしたときは、各出力ニューロン
間で発火値yiの差が小さいので学習率αが小さくな
る。そして、何度か学習が行われたようなデータを学習
するときは、次第に各出力ニューロン間で発火値yi
差が大きくなっていった結果として学習率αが高まる。
これは、ノイズであるかも知れないデータは強く学習せ
ず、ノイズ・データでないことを確認できたときに強く
学習するという効果を持つ。この結果、ロボット装置1
は、ノイズのようなデータは強く覚えることはなくな
り、記憶情報の混乱を起こす可能性が低くなる。
【0150】さらに何度も学習したようなデータを学習
しようとしたときは再び学習率αを小さくする。既に強
く学習がなされているデータは、あまり覚える必要がな
く、また、さらに強く学習してしまうことよって他の重
要な学習データを弱めてしまうことになることを避ける
ために、弱く学習する。
【0151】C−3−3.他の要素を利用した記憶能力
の制御 上述した例では、ロボット装置1(又は人工エージェン
ト)における成長時間tや記憶の確からしさに応じて記
憶能力を制御する。勿論、これら以外の要素を用いて学
習率すなわち記憶能力を制御することが可能である。
【0152】例えば、本能、感情、1日の時間帯、場所
(シーン)やロボット装置1が遭遇する場面などの要素
に応じて記憶能力を制御することもできる。また、これ
らのうち2以上の要素を用いて記憶能力を制御すること
もできる。
【0153】ロボット装置1の本能(I:Instinct)に
応じて学習率αを制御する場合、学習率αを本能の関数
α(I)として定義すればよい。図10には、本能と学
習率αとの関係を示している。同図に示す例では、空腹
の度合いが進行するにつれて学習率αが小さくなり、記
憶能力が落ち込んでいく。逆に空腹が解消されるにつれ
て集中力が増して学習率αが大きくなり、記憶能力が向
上するが、満腹に近づくにつれて学習率がやがて低下し
始めて、記憶能力が低下する。このような記憶能力の変
動は、生命体に類似するものである。
【0154】また、ロボット装置1の感情(e:emotio
n)に応じて学習率αを制御する場合、学習率αを感情
eの関数α(e)として定義すればよい。図11には、
感情と学習率αとの関係を示している。同図に示す例で
は、つまらない状態では退屈のため学習率αが小さくな
り、記憶能力が落ち込んでいく。逆に、楽しい状態では
物事を受け容れ易くなり学習率αが大きくなり、記憶能
力が向上する。このような記憶能力の変動は、生命体に
類似するものである。
【0155】また、1日の時間に応じて学習率αを制御
する場合、学習率αを時刻又はスケジュールsの関数α
(s)として定義すればよい。図12には、1日の時刻
と学習率αとの関係を示している。同図に示す例では、
朝起きたばかりの状態ではまだ眠いため学習率αが小さ
く、記憶能力が低い。そして、朝食をとった後では、空
腹感が癒されるとともに目が覚めてくることにより集中
力が高まるので、学習率αが大きくなり、記憶能力が向
上する。また、昼食後など眠い時間帯にかかると、集中
力が低下してくるので、学習率αが小さくなり、記憶能
力が低下する。また、就寝する時間帯になると、睡魔の
ために学習率が小さくなり、記憶能力が低下する。この
ような記憶能力の変動は、生命体に類似するものであ
る。
【0156】また、ロボット装置1が遭遇する場面
(l:location)に応じて学習率αを制御する場合、学
習率αを遭遇する場面lの関数α(l)として定義すれ
ばよい。図13には、場所と学習率αとの関係を示して
いる。同図に示す例では、学校にいるときなど窮屈な状
態では気分が乗らないため学習率αが小さくなり、記憶
能力が落ち込んでいく。逆に、家や畑にいるときなどリ
ラックスしている状態では物事を受け容れ易くなり学習
率αが大きくなり、記憶能力が向上する。このような記
憶能力の変動は、生命体に類似するものである。
【0157】[追補]以上、特定の実施形態を参照しな
がら、本発明について詳解してきた。しかしながら、本
発明の要旨を逸脱しない範囲で当業者が該実施形態の修
正や代用を成し得ることは自明である。
【0158】上述した実施形態では本発明に係る連想記
憶メカニズムをロボット装置に適用した場合を中心に説
明してきたが。本発明の要旨は、必ずしも「ロボット」
と称される製品には限定されない。すなわち、電気的若
しくは磁気的な作用を用いて人間の動作に似せた運動を
行う機械装置、あるいは記憶機能に基づくインターラク
ションを行なう対話装置又は電子エージェントであるな
らば、例えば玩具等のような他の産業分野に属する製品
であっても、同様に本発明を適用することができる。
【0159】要するに、例示という形態で本発明を開示
してきたのであり、本明細書の記載内容を限定的に解釈
するべきではない。本発明の要旨を判断するためには、
冒頭に記載した特許請求の範囲の欄を参酌すべきであ
る。
【0160】
【発明の効果】以上詳記したように、本発明によれば、
事物を記憶する記憶能力を備えて記憶内容を基に自律的
に動作することができる、優れたロボット装置及びその
制御方法、人工エージェント、記憶制御装置及び記憶制
御方法を提供することができる。
【0161】また、本発明によれば、記憶能力に変化を
持たせて、よりリアルでユーザに飽きさせないインタラ
クションを行なうことができる、優れたロボット装置及
びその制御方法、人工エージェント、記憶制御装置及び
記憶制御方法を提供することができる。
【0162】また、本発明によれば、生命体の成長の度
合いや情報の確信度などに応じて記憶能力を動的に変更
して、擬似生命体らしく、且つ効率的な記憶を行なうこ
とができる、優れたロボット装置及びその制御方法、人
工エージェント、記憶制御装置及び記憶制御方法を提供
することができる。
【図面の簡単な説明】
【図1】本発明に実施に供されるロボット装置1の機能
構成を模式的に示した図である。
【図2】制御ユニット20の構成をさらに詳細に示した
図である。
【図3】本発明の実施形態に係るロボット装置1の行動
制御システム100の機能構成を模式的に示した図であ
る。
【図4】連想記憶システムの記憶過程を概念的に示した
図である。
【図5】連想記憶システムの想起過程を概念的に示した
図である。
【図6】競合型ニューラル・ネットワークを適用した連
想記憶システムの構成例を模式的に示した図である。
【図7】成長時間tに応じて記憶能力を制御するための
記憶能力制御システム200の機能構成を模式的に示し
た図である。
【図8】記憶の確信度に応じて記憶能力を制御するため
の記憶能力制御システム200−2の機能構成を模式的
に示した図である。
【図9】記憶の確信度σ2と学習率αとの関係を示した
チャートである。
【図10】ロボット装置1が持つ本能と学習率αとの関
係を示したチャートである。
【図11】ロボット装置1が持つ感情と学習率αとの関
係を示したチャートである。
【図12】1日の時間と学習率αとの関係を示したチャ
ートである。
【図13】ロボット装置1が遭遇する場所と学習率αと
の関係を示したチャートである。
【符号の説明】
1…ロボット装置 15…CCDカメラ 16…マイクロフォン 17…スピーカ 18…タッチセンサ 19…LEDインジケータ 20…制御部 21…CPU 22…RAM 23…ROM 24…不揮発メモリ 25…インターフェース 26…無線通信インターフェース 27…ネットワーク・インターフェース・カード 28…バス 29…キーボード 40…入出力部 50…駆動部 51…モータ 52…エンコーダ 53…ドライバ 100…行動制御システム 101…視覚認識機能部 102…聴覚認識機能部 103…接触認識機能部 105…短期記憶部 106…長期記憶部 107…熟考行動階層 108…状況依存行動階層 109…反射行動部 200…記憶能力制御システム 201…入力部 202…強化シンボル特定部 203…強化度計算部 204…記憶更新部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06N 3/00 550 G06N 3/00 550E // A63H 3/28 A63H 3/28 Z 3/38 3/38 A 13/02 13/02 G Fターム(参考) 2C150 CA11 CA12 DA04 DA05 DA28 DF02 DG02 DK02 DK10 EA18 EB01 ED47 ED56 EE07 EF16 EF34 EF36 FA03 3C007 AS27 AS36 CS08 KS31 KS39 KT01 LW12 LW15 MT14 WA02 WA12 WB15 WB16 WC01 WC07 5H004 GA26 GB16 KD52 KD63

Claims (39)

    【特許請求の範囲】
  1. 【請求項1】関節駆動又はユーザとの対話駆動を行う駆
    動部と、 入力されたパターンを所定の学習率で記憶する記憶部
    と、 前記記憶部における学習率を変化させる記憶能力制御部
    と、 前記記憶部により記憶されたパターンを想起して前記駆
    動部による機体動作を制御する行動制御部と、を具備す
    ることを特徴とするロボット装置。
  2. 【請求項2】前記学習率はパターンが提示された回数と
    記憶の関係を表すパラメータである、ことを特徴とする
    請求項1に記載のロボット装置。
  3. 【請求項3】前記記憶部は、 入力パターンに応じて発火する複数の入力ニューロンか
    らなる入力層と、各入力ニューロンからの出力を結合力
    に応じて重み付け入力する複数の競合ニューロンからな
    る競合層とを備えた競合型ニューラル・ネットワークで
    構成され、 ある入力パターンに対して各入力ニューロンからの重み
    付け入力値の総和が最大となる競合ニューロンを選択し
    て、該競合ニューロンと各入力ニューローンとの結合力
    を強めることによって、該入力パターンの記憶を強化す
    るとともに、 一部が欠損した入力パターンに対して各入力ニューロン
    からの重み付け入力値の総和が最大となる競合ニューロ
    ンを選択して、該競合ニューロンと結合力の強い入力ニ
    ューローンからなる記憶パターンを想起する、ことを特
    徴とする請求項1に記載のロボット装置。
  4. 【請求項4】前記学習率はパターンが提示された回数に
    応じて競合ニューロンと各入力ニューローンとの結合力
    を強める度合いを表すパラメータである、ことを特徴と
    する請求項3に記載のロボット装置。
  5. 【請求項5】前記記憶能力制御部は前記ロボット装置の
    成長時間に応じて学習率を変化させる、ことを特徴とす
    る請求項1に記載のロボット装置。
  6. 【請求項6】前記記憶能力制御部は、生まれたときの学
    習率を高い値に設定するとともに所定の基準時間に近づ
    くにつれて学習率を低下させていく、ことを特徴とする
    請求項1に記載のロボット装置。
  7. 【請求項7】前記記憶能力制御部は記憶の確からしさに
    応じて学習率を変化させる、ことを特徴とする請求項1
    に記載のロボット装置。
  8. 【請求項8】前記記憶能力制御部は、競合に勝ち抜いた
    出力ニューロンの発火値とそれ以外の出力ニューロンの
    発火値との偏差に応じて学習率を変化させる、ことを特
    徴とする請求項3に記載のロボット装置。
  9. 【請求項9】前記記憶能力制御部は前記ロボット装置の
    本能に応じて学習率を変化させる、ことを特徴とする請
    求項1に記載のロボット装置。
  10. 【請求項10】前記記憶能力制御部は前記ロボット装置
    の感情に応じて学習率を変化させる、ことを特徴とする
    請求項1に記載のロボット装置。
  11. 【請求項11】前記記憶能力制御部は1日のうちの時間
    帯に応じて学習率を変化させる、ことを特徴とする請求
    項1に記載のロボット装置。
  12. 【請求項12】前記記憶能力制御部は前記ロボット装置
    が遭遇する場面に応じて学習率を変化させる、ことを特
    徴とする請求項1に記載のロボット装置。
  13. 【請求項13】関節駆動又はユーザとの対話駆動を行う
    ロボット装置の制御方法であって、 入力されたパターンを所定の学習率で記憶する記憶ステ
    ップと、 前記記憶部における学習率を変化させる記憶能力制御ス
    テップと、 前記記憶部により記憶されたパターンを想起して前記ロ
    ボット装置の機体動作を制御する行動制御ステップと、
    を具備することを特徴とするロボット装置の制御方法。
  14. 【請求項14】前記学習率はパターンが提示された回数
    と記憶の関係を表すパラメータである、ことを特徴とす
    る請求項13に記載のロボット装置の制御方法。
  15. 【請求項15】前記記憶ステップでは、 入力パターンに応じて発火する複数の入力ニューロンか
    らなる入力層と、各入力ニューロンからの出力を結合力
    に応じて重み付け入力する複数の競合ニューロンからな
    る競合層とを備えた競合型ニューラル・ネットワークを
    用いて、 ある入力パターンに対して各入力ニューロンからの重み
    付け入力値の総和が最大となる競合ニューロンを選択し
    て、該競合ニューロンと各入力ニューローンとの結合力
    を強めることによって、該入力パターンの記憶を強化す
    るとともに、 一部が欠損した入力パターンに対して各入力ニューロン
    からの重み付け入力値の総和が最大となる競合ニューロ
    ンを選択して、該競合ニューロンと結合力の強い入力ニ
    ューローンからなる記憶パターンを想起する、ことを特
    徴とする請求項13に記載のロボット装置の制御方法。
  16. 【請求項16】前記学習率はパターンが提示された回数
    に応じて競合ニューロンと各入力ニューローンとの結合
    力を強める度合いを表すパラメータである、ことを特徴
    とする請求項15に記載のロボット装置の制御方法。
  17. 【請求項17】前記記憶能力制御ステップでは前記ロボ
    ット装置の成長時間に応じて学習率を変化させる、こと
    を特徴とする請求項13に記載のロボット装置の制御方
    法。
  18. 【請求項18】前記記憶能力制御ステップでは、生まれ
    たときの学習率を高い値に設定するとともに所定の基準
    時間に近づくにつれて学習率を低下させていく、ことを
    特徴とする請求項13に記載のロボット装置の制御方
    法。
  19. 【請求項19】前記記憶能力制御ステップでは記憶の確
    からしさに応じて学習率を変化させる、ことを特徴とす
    る請求項13に記載のロボット装置の制御方法。
  20. 【請求項20】前記記憶能力制御ステップでは、競合に
    勝ち抜いた出力ニューロンの発火値とそれ以外の出力ニ
    ューロンの発火値との偏差に応じて学習率を変化させ
    る、ことを特徴とする請求項15に記載のロボット装置
    の制御方法。
  21. 【請求項21】前記記憶能力制御ステップでは前記ロボ
    ット装置の本能に応じて学習率を変化させる、ことを特
    徴とする請求項13に記載のロボット装置の制御方法。
  22. 【請求項22】前記記憶能力制御ステップでは前記ロボ
    ット装置の感情に応じて学習率を変化させる、ことを特
    徴とする請求項13に記載のロボット装置の制御方法。
  23. 【請求項23】前記記憶能力制御ステップでは1日のう
    ちの時間帯に応じて学習率を変化させる、ことを特徴と
    する請求項13に記載のロボット装置の制御方法。
  24. 【請求項24】前記記憶能力制御ステップでは前記ロボ
    ット装置が遭遇する場面に応じて学習率を変化させる、
    ことを特徴とする請求項13に記載のロボット装置の制
    御方法。
  25. 【請求項25】ユーザとのインタラクションを行う対話
    部と、 入力されたパターンを所定の学習率で記憶する記憶部
    と、 前記記憶部における学習率を変化させる記憶能力制御部
    と、 前記記憶部により記憶されたパターンを想起して前記対
    話部によるインタラクションを制御する行動制御部と、
    を具備することを特徴とする人工エージェント。
  26. 【請求項26】前記記憶部は、入力パターンに応じて発
    火する複数の入力ニューロンからなる入力層と、各入力
    ニューロンからの出力を結合力に応じて重み付け入力す
    る複数の競合ニューロンからなる競合層とを備えた競合
    型ニューラル・ネットワークで構成され、ある入力パタ
    ーンに対して各入力ニューロンからの重み付け入力値の
    総和が最大となる競合ニューロンを選択して、該競合ニ
    ューロンと各入力ニューローンとの結合力を強めること
    によって、該入力パターンの記憶を強化するとともに、 一部が欠損した入力パターンに対して各入力ニューロン
    からの重み付け入力値の総和が最大となる競合ニューロ
    ンを選択して、該競合ニューロンと結合力の強い入力ニ
    ューローンからなる記憶パターンを想起する、ことを特
    徴とする請求項25に記載の人工エージェント。
  27. 【請求項27】前記学習率はパターンが提示された回数
    に応じて競合ニューロンと各入力ニューローンとの結合
    力を強める度合いを表すパラメータである、ことを特徴
    とする請求項26に記載の人工エージェント。
  28. 【請求項28】前記記憶能力制御部は前記人工エージェ
    ントの成長時間に応じて学習率を変化させる、ことを特
    徴とする請求項25に記載の人工エージェント。
  29. 【請求項29】前記記憶能力制御部は記憶の確からしさ
    に応じて学習率を変化させる、ことを特徴とする請求項
    25に記載の人工エージェント。
  30. 【請求項30】前記記憶能力制御部は前記人工エージェ
    ントの本能に応じて学習率を変化させる、ことを特徴と
    する請求項25に記載の人工エージェント。
  31. 【請求項31】前記記憶能力制御部は前記人工エージェ
    ントの感情に応じて学習率を変化させる、ことを特徴と
    する請求項25に記載の人工エージェント。
  32. 【請求項32】前記記憶能力制御部は1日のうちの時間
    帯に応じて学習率を変化させる、ことを特徴とする請求
    項25に記載の人工エージェント。
  33. 【請求項33】前記記憶能力制御部は前記人工エージェ
    ントが遭遇する場面に応じて学習率を変化させる、こと
    を特徴とする請求項25に記載の人工エージェント。
  34. 【請求項34】入力パターンに応じて発火する複数の入
    力ニューロンからなる入力層と、各入力ニューロンから
    の出力を結合力に応じて重み付け入力する複数の競合ニ
    ューロンからなる競合層とで構成される競合型ニューラ
    ル・ネットワークを用いて、ある入力パターンに対して
    各入力ニューロンからの重み付け入力値の総和が最大と
    なる競合ニューロンを選択して該競合ニューロンと各入
    力ニューローンとの結合力を強めることにより記憶する
    とともに、一部が欠損した入力パターンに対して各入力
    ニューロンからの重み付け入力値の総和が最大となる競
    合ニューロンを選択して該競合ニューロンと結合力の強
    い入力ニューローンからなる記憶パターンを想起する記
    憶メカニズムを制御する記憶制御装置であって、 競合ニューロンと各入力ニューローンとの結合力を強め
    る度合いを表す学習率を変化させる記憶能力制御部を備
    える、ことを特徴とする記憶制御装置。
  35. 【請求項35】前記記憶能力制御部は前記記憶メカニズ
    ムの成長時間に応じて学習率を変化させる、ことを特徴
    とする請求項34に記載の記憶制御装置。
  36. 【請求項36】前記記憶能力制御部は、競合に勝ち抜い
    た出力ニューロンの発火値とそれ以外の出力ニューロン
    の発火値との偏差に応じて学習率を変化させる、ことを
    特徴とする請求項34に記載の記憶制御装置。
  37. 【請求項37】入力パターンに応じて発火する複数の入
    力ニューロンからなる入力層と、各入力ニューロンから
    の出力を結合力に応じて重み付け入力する複数の競合ニ
    ューロンからなる競合層とで構成される競合型ニューラ
    ル・ネットワークを用いた記憶メカニズムにおける記憶
    動作を制御する記憶制御方法であって、 ある入力パターンに対して各入力ニューロンからの重み
    付け入力値の総和が最大となる競合ニューロンを選択し
    て該競合ニューロンと各入力ニューローンとの結合力を
    強める記憶ステップと、 競合ニューロンと各入力ニューローンとの結合力を強め
    る度合いを表す学習率を変化させる記憶能力制御ステッ
    プと、 一部が欠損した入力パターンに対して各入力ニューロン
    からの重み付け入力値の総和が最大となる競合ニューロ
    ンを選択して該競合ニューロンと結合力の強い入力ニュ
    ーローンからなる記憶パターンを想起する想起ステップ
    と、を具備することを特徴とする記憶制御方法。
  38. 【請求項38】前記記憶能力制御ステップでは前記記憶
    メカニズムの成長時間に応じて学習率を変化させる、こ
    とを特徴とする請求項37に記載の記憶制御方法。
  39. 【請求項39】前記記憶能力制御ステップでは、競合に
    勝ち抜いた出力ニューロンの発火値とそれ以外の出力ニ
    ューロンの発火値との偏差に応じて学習率を変化させ
    る、ことを特徴とする請求項37に記載の記憶制御方
    法。
JP2001394889A 2001-12-26 2001-12-26 ロボット装置及びその制御方法、人工エージェント、記憶制御装置及び記憶制御方法 Pending JP2003200369A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001394889A JP2003200369A (ja) 2001-12-26 2001-12-26 ロボット装置及びその制御方法、人工エージェント、記憶制御装置及び記憶制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001394889A JP2003200369A (ja) 2001-12-26 2001-12-26 ロボット装置及びその制御方法、人工エージェント、記憶制御装置及び記憶制御方法

Publications (1)

Publication Number Publication Date
JP2003200369A true JP2003200369A (ja) 2003-07-15

Family

ID=27639497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001394889A Pending JP2003200369A (ja) 2001-12-26 2001-12-26 ロボット装置及びその制御方法、人工エージェント、記憶制御装置及び記憶制御方法

Country Status (1)

Country Link
JP (1) JP2003200369A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017173546A (ja) * 2016-03-23 2017-09-28 カシオ計算機株式会社 学習支援装置、ロボット、学習支援システム、学習支援方法及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017173546A (ja) * 2016-03-23 2017-09-28 カシオ計算機株式会社 学習支援装置、ロボット、学習支援システム、学習支援方法及びプログラム

Similar Documents

Publication Publication Date Title
JP4661074B2 (ja) 情報処理システム、情報処理方法、並びにロボット装置
KR101137205B1 (ko) 로봇의 행동 제어 시스템 및 행동 제어 방법, 및 로봇 장치
JP2005193331A (ja) ロボット装置及びその情動表出方法
US8538750B2 (en) Speech communication system and method, and robot apparatus
US7024276B2 (en) Legged mobile robot and its motion teaching method, and storage medium
CN100364731C (zh) 机器人装置、其行为控制方法及程序
JP2003175480A (ja) ロボット装置及びその行動制御方法、連想記憶装置及び連想記憶方法
US7987091B2 (en) Dialog control device and method, and robot device
KR20030007533A (ko) 로봇 장치의 동작 제어 방법, 프로그램, 기록 매체 및로봇 장치
JP2006110707A (ja) ロボット装置
JP2007125631A (ja) ロボット装置及びその行動制御方法
JP3558222B2 (ja) ロボットの行動制御システム及び行動制御方法、並びにロボット装置
JP2002205291A (ja) 脚式ロボット及び脚式ロボットの行動制御方法、並びに記憶媒体
JP2002086378A (ja) 脚式ロボットに対する動作教示システム及び動作教示方法
JP2007125629A (ja) ロボット装置及びその行動制御方法
JP2002059384A (ja) ロボットのための学習システム及び学習方法
JP2003200369A (ja) ロボット装置及びその制御方法、人工エージェント、記憶制御装置及び記憶制御方法
JP2002086380A (ja) 脚式ロボット及びその制御方法
JP2002205289A (ja) ロボット装置の動作制御方法、プログラム、記録媒体及びロボット装置
JP4147960B2 (ja) ロボット装置、及びロボット装置の動作制御方法
JP2004291228A (ja) ロボット装置及びロボット装置の行動制御方法、並びにコンピュータ・プログラム
JP2005193330A (ja) ロボット装置及びその情動表出方法
JP2002337075A (ja) 脚式移動ロボット及びその学習方法
JP2003136451A (ja) ロボット装置及びその制御方法
JP2007125630A (ja) ロボット装置及びその行動制御方法