JP2004268235A - ロボット装置、その行動制御方法及びプログラム - Google Patents

ロボット装置、その行動制御方法及びプログラム Download PDF

Info

Publication number
JP2004268235A
JP2004268235A JP2003065587A JP2003065587A JP2004268235A JP 2004268235 A JP2004268235 A JP 2004268235A JP 2003065587 A JP2003065587 A JP 2003065587A JP 2003065587 A JP2003065587 A JP 2003065587A JP 2004268235 A JP2004268235 A JP 2004268235A
Authority
JP
Japan
Prior art keywords
action
internal state
value
behavior
external stimulus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003065587A
Other languages
English (en)
Inventor
Tsutomu Sawada
務 澤田
Masahiro Fujita
雅博 藤田
Takeshi Takagi
剛 高木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2003065587A priority Critical patent/JP2004268235A/ja
Priority to PCT/JP2004/003030 priority patent/WO2004080665A1/ja
Priority to CNB2004800065833A priority patent/CN100364731C/zh
Priority to EP04718724A priority patent/EP1602457B1/en
Priority to US10/547,922 priority patent/US7853357B2/en
Publication of JP2004268235A publication Critical patent/JP2004268235A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J13/00Controls for manipulators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/008Artificial life, i.e. computing arrangements simulating life based on physical entities controlled by simulated intelligence so as to replicate intelligent life forms, e.g. based on robots replicating pets or humans in their appearance or behaviour

Abstract

【課題】エンターテイメントロボットとしてユーザを飽きさせない行動を発現する。
【解決手段】行動選択制御システム100は、選択されると行動を出力する複数の要素行動と、内部状態管理部91及び外部刺激認識部80からの情報に基づき、データベースを参照して各要素行動の行動価値ALを算出する行動価値算出部120と、行動価値ALが最も大きい要素行動を発現する行動として選択する行動選択部130とを有する。各行動には、所定の内部状態及び外部刺激が対応付けられ、行動価値算出部120は、入力された内部状態に対応する行動に対する欲求値と、入力された外部刺激により変化すると予想される予想内部状態変化に基づく予想満足度変化とから、各行動に対する行動価値ALを算出する。
【選択図】 図4

Description

【0001】
【発明の属する技術分野】
本発明は、自律的に行動を発現するロボット装置、その行動制御方法及びプログラムに関し、特に、自身の内部状態と外部刺激とから発現する行動を選択するロボット装置、その行動制御方法及びプログラムに関する。
【0002】
【従来の技術】
近年、産業用ロボット装置に代わり、新しいロボット装置の分野として人間共存型ロボット装置やエンターテインメントロボット装置の研究が進められている。このようなロボット装置は、センサ等からの外部刺激の情報を使用して行動を発現するようになされている。
【0003】
例えば、下記非特許文献1にはロボット装置の自己保存の観点からの評価に基づきロボットの行動を生成する方法が開示されている。自己保存の観点からの評価とは、自己のハードウェアの耐久性、故障率の観点からこれを評価するもので、具体的には、外界情報(視覚・聴覚のセンサ入力)だけでなく、自己のバッテリ状態や消費電力、回路温度等の情報からなる入力情報を身体の耐久性の評価値(故障率)に変換する自己保存評価関数を計算し、複数の動作形態のうち、行動を行っている状態から、実際に他の行動に指令を与えて行動状態を変移させるために、内外感覚情報及び自己保存評価関数の値を監視することで、行動状態を変移させる。これにより、ロボット装置の行動は、自己保存評価が良くなる方へ近づき、悪くなる方は避けるという自己保存の評価から生まれる志向性(好き嫌い)を反映したものとすることができる。
【0004】
また、このロボット装置は、「情」のモデル化のために自己保存評価関数を導入し、例えば充電されると喜びの反応として黄色の表出をしたり、放電されると恐怖の反のとして青色を表出したりすることで、情動表出を行うことができる。
【0005】
【非特許文献1】
尾形哲也、菅野重樹、「自己保存に基づくロボットの行動生成−方法論と機械モデルの実現化−」、日本ロボット学会誌、1997年、第15巻、第5号、p.710−721
【0006】
【発明が解決しようとする課題】
しかしながら、この非特許文献1に記載のロボット装置の「自己の保存」に基づいた価値観は、充電なら良、放電なら悪、というような単純なものであり、人間に対して一方向のコミュニケーションしか実現できていない。
【0007】
また、このような人間共存型ロボット装置や、エンターテインメントロボット装置のような玩具機械的な位置づけのロボット装置は、外部刺激のみを行動選択のトリガとしているものが多く、ユーザ操作と応答動作との関係が固定的であった。その結果、ユーザは同じ外部刺激に対して、同じ動作しか繰り返さない玩具に対し、容易に飽きを感じてしまうことが多かった。
【0008】
近時、本能や感情といった情動をモデル化してシステムの内部状態を管理し、内部状態の変化に応じて行動を選択するシステムが提案されているものの、内部状態と外部刺激に対して選択される行動は固定的なものが多く、ユーザや環境とのインタラクションを通じてそれを変えることは困難であった。
【0009】
ロボット装置が現在の状況に応じた最適な次の行動及び動作を行わせる機能や、過去の経験に基づいて次の行動及び動作を変化させる機能を搭載することができれば、より一層の親近感や満足感をユーザに与えて、ロボット装置としてのアミューズメント性をより向上させると共に、ユーザとのインタラクションを円滑に行うことができて便利である。
【0010】
本発明は、このような従来の実情に鑑みて提案されたものであり、エンターテイメントロボットとしてユーザを飽きさせない行動を発現することができるロボット装置、その行動制御方法及びプログラムを提供することを目的とする。
【0011】
【課題を解決するための手段】
上述した目的を達成するために、本発明に係るロボット装置は、内部状態及び外部刺激に基づき自律的に行動を選択し発現するロボット装置において、行動が記述された複数の行動記述モジュールと、上記内部状態及び外部刺激から上記複数の行動記述モジュールに記述された各行動の行動価値を算出する行動価値算出手段と、上記行動価値に基づき上記行動記述モジュールを選択し、当該行動記述モジュールに記述された行動を発現させる行動選択手段とを有し、各上記行動記述モジュールに記述された行動には所定の内部状態及び外部刺激が対応付けられ、上記行動価値算出手段は、内部状態に対応付けられた行動に対する欲求値及び内部状態に基づく満足度を求め、現在の内部状態から求まる欲求値と、上記現在の内部状態及び入力された外部刺激に基づき変化すると予想される予想内部状態から求まる予想満足度変化とに基づき、各行動に対する上記行動価値を算出することを特徴とする。
【0012】
本発明においては、現在の内部状態に対応する行動に対する欲求値を求め、また、現在の内部状態に対する満足度と、外部刺激が入力され、行動を発現した後に変化すると予想される予想内部状態に対応する予想満足度と差である予想満足度変化を求め、これらから行動価値を算出し、この行動価値に基づき発現する行動を選択するので、環境やユーザとのコミュニケーションに応じて変化する内部状態及び種々の外部刺激に対して一義的ではない様々な行動を発現することができる。
【0013】
また、上記行動価値算出手段は、上記現在の内部状態から求まる上記欲求値と、該現在の内部状態から求まる上記満足度と、上記予想満足度変化とに基づき、各行動に対する上記行動価値を算出してもよい。
【0014】
更に、上記行動価値算出手段は、入力される外部刺激と、上記予想内部状態変化とが対応付けられた行動価値算出データベースを有し、この行動価値算出データベースを参照して上記行動価値を算出することができ、コミュニケーションをとるユーザや、環境に応じて異なるデータベースを用意することができる。
【0015】
更にまた、上記行動価値算出データベースは、上記外部刺激の値に対応付けられた上記予想内部状態変化を有し、行動価値算出データベースにはない値が入力された場合は、線形モデルを使用し線形補間を行って予想内部状態変化を算出することができ、各外部刺激が有する値全てに対応する予想内部状態変化を持つ必要がなくデータ量を低減することができる。
【0016】
本発明に係るロボット装置の行動制御方法は、内部状態及び外部刺激に基づき自律的に行動を選択して発現するような制御を行うロボット装置の行動制御方法において、上記内部状態及び外部刺激から複数の行動記述モジュールに記述された各行動の行動価値を算出する行動価値算出工程と、上記行動価値に基づき上記行動記述モジュールを選択し、当該行動記述モジュールに記述された行動を発現させる行動選択工程とを有し、各上記行動記述モジュールに記述された行動には所定の内部状態及び外部刺激が対応付けられ、上記行動価値算出工程では、内部状態に対応付けられた行動に対する欲求値及び内部状態に基づく満足度を求め、現在の内部状態から求まる欲求値と、上記現在の内部状態及び入力された外部刺激に基づき変化すると予想される予想内部状態から求まる予想満足度変化とに基づき、各行動に対する上記行動価値が算出されることを特徴とする。
【0017】
また、本発明に係るプログラムは、上述した内部状態及び外部刺激に基づき自律的に行動を選択して発現するような制御をコンピュータに実行させるものである。
【0018】
【発明の実施の形態】
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、ペット型エージェント、人間型エージェント等生命を模擬し、ユーザとのインタラクションを可能とするロボット装置に適用したものであるが、ここでは先ず、このようなロボット装置の構成について説明し、次にロボット装置の制御システムのうち、行動選択を行う行動選択制御システムについて説明し、最後にそのような行動選択制御システムを含むロボット装置の制御システムについて説明する。
【0019】
(A)ロボット装置の構成
図1は、本実施の形態のロボット装置の外観を示す斜視図である。図1に示すように、ロボット装置1は、体幹部ユニット2の所定の位置に頭部ユニット3が連結されると共に、左右2つの腕部ユニット4R/Lと、左右2つの脚部ユニット5R/Lが連結されて構成されている(但し、R及びLの各々は、右及び左の各々を示す接尾辞である。以下において同じ。)。
【0020】
図2は、本実施の形態におけるロボット装置1の機能構成を模式的に示すブロック図である。図2に示すように、ロボット装置1は、全体の動作の統括的制御及びその他のデータ処理を行う制御ユニット20と、入出力部40と、駆動部50と、電源部60とで構成される。以下、各部について説明する。
【0021】
入出力部40は、入力部として人間の目に相当し、外部の状況を撮影するCCDカメラ15、及び耳に相当するマイクロフォン16や頭部や背中等の部位に配設され、所定の押圧を受けるとこれを電気的に検出することで、ユーザの接触を感知するタッチ・センサ18、前方に位置する物体までの距離を測定するための距離センサ、五感に相当するその他、ジャイロセンサ等、各種のセンサを含む。また、出力部として、頭部ユニット3に備えられ、人間の口に相当するスピーカ17、及び人間の目の位置に設けられ、感情表現や視覚認識状態を表現する例えばLEDインジケータ(目ランプ)19等を装備しており、これら出力部は、音声やLEDインジケータ19の点滅等、脚等による機械運動パターン以外の形式でもロボット装置1からのユーザ・フィードバックを表現することができる。
【0022】
例えば頭部ユニットの頭頂部の所定箇所に複数のタッチ・センサ18を設け、各タッチ・センサ18における接触検出を複合的に活用して、ユーザからの働きかけ、例えばロボット装置1の頭部を「撫でる」「叩く」「軽く叩く」等を検出することができ、例えば、押圧センサのうちの幾つかが所定時間をおいて順次接触したことを検出した場合、これを「撫でられた」と判別し、短時間のうちに接触を検出した場合、「叩かれた」と判別する等場合分けし、これに応じて内部状態も変化し、このような内部状態の変化を上述の出力部等により表現することができる。
【0023】
駆動部50は、制御ユニット20が指令する所定の運動パターンに従ってロボット装置1の機体動作を実現する機能ブロックであり、行動制御による制御対象である。駆動部50は、ロボット装置1の各関節における自由度を実現するための機能モジュールであり、それぞれの関節におけるロール、ピッチ、ヨー等各軸毎に設けられた複数の駆動ユニット541〜54nで構成される。各駆動ユニット541〜54nは、所定軸回りの回転動作を行うモータ511〜51nと、モータ511〜51nの回転位置を検出するエンコーダ521〜52nと、エンコーダ521〜52nの出力に基づいてモータ511〜51nの回転位置や回転速度を適応的に制御するドライバ531〜53nとの組み合わせで構成される。
【0024】
本ロボット装置1は、2足歩行としたが、駆動ユニットの組み合わせ方によって、ロボット装置1を例えば4足歩行等の脚式移動ロボット装置として構成することもできる。
【0025】
電源部60は、その字義通り、ロボット装置1内の各電気回路等に対して給電を行う機能モジュールである。本参考例に係るロボット装置1は、バッテリを用いた自律駆動式であり、電源部60は、充電バッテリ61と、充電バッテリ61の充放電状態を管理する充放電制御部62とで構成される。
【0026】
充電バッテリ61は、例えば、複数本のリチウムイオン2次電池セルをカートリッジ式にパッケージ化した「バッテリ・パック」の形態で構成される。
【0027】
また、充放電制御部62は、バッテリ61の端子電圧や充電/放電電流量、バッテリ61の周囲温度等を測定することでバッテリ61の残存容量を把握し、充電の開始時期や終了時期等を決定する。充放電制御部62が決定する充電の開始及び終了時期は制御ユニット20に通知され、ロボット装置1が充電オペレーションを開始及び終了するためのトリガとなる。
【0028】
制御ユニット20は、「頭脳」に相当し、例えばロボット装置1の機体頭部あるいは胴体部に搭載されている。
【0029】
図3は、制御ユニット20の構成を更に詳細に示すブロック図である。図3に示すように、制御ユニット20は、メイン・コントローラとしてのCPU(Central Processing Unit)21が、メモリ及びその他の各回路コンポーネントや周辺機器とバス接続された構成となっている。バス28は、データ・バス、アドレス・バス、コントロール・バス等を含む共通信号伝送路である。バス28上の各装置にはそれぞれに固有のアドレス(メモリ・アドレス又はI/Oアドレス)が割り当てられている。CPU21は、アドレスを指定することによってバス28上の特定の装置と通信することができる。
【0030】
RAM(Random Access Memory)22は、DRAM(Dynamic RAM)等の揮発性メモリで構成された書き込み可能メモリであり、CPU21が実行するプログラム・コードをロードしたり、実行プログラムによる作業データの一時的に保存そたりするために使用される。
【0031】
ROM(Read Only Memory)23は、プログラムやデータを恒久的に格納する読み出し専用メモリである。ROM23に格納されるプログラム・コードには、ロボット装置1の電源投入時に実行する自己診断テスト・プログラムや、ロボット装置1の動作を規定する動作制御プログラム等が挙げられる。
【0032】
ロボット装置1の制御プログラムには、カメラ15やマイクロフォン16等のセンサ入力を処理してシンボルとして認識する「センサ入力・認識処理プログラム」、短期記憶や長期記憶等の記憶動作(後述)を司りながらセンサ入力と所定の行動制御モデルとに基づいてロボット装置1の行動を制御する「行動制御プログラム」、行動制御モデルに従って各関節モータの駆動やスピーカ17の音声出力等を制御する「駆動制御プログラム」等が含まれる。
【0033】
不揮発性メモリ24は、例えばEEPROM(Electrically Erasable and Programmable ROM)のように電気的に消去再書き込みが可能なメモリ素子で構成され、逐次更新すべきデータを不揮発的に保持するために使用される。逐次更新すべきデータには、暗号鍵やその他のセキュリティ情報、出荷後にインストールすべき装置制御プログラム等が挙げられる。
【0034】
インターフェース25は、制御ユニット20外の機器と相互接続し、データ交換を可能にするための装置である。インターフェース25は、例えば、カメラ15、マイクロフォン16、又はスピーカ17等との間でデータ入出力を行う。また、インターフェース25は、駆動部50内の各ドライバ531〜53nとの間でデータやコマンドの入出力を行う。
【0035】
また、インターフェース25は、RS(Recommended Standard)−232C等のシリアル・インターフェース、IEEE(Institute of Electrical and electronics Engineers)1284等のパラレル・インターフェース、USB(Universal Serial Bus)インターフェース、i−Link(IEEE1394)インターフェース、SCSI(Small Computer System Interface)インターフェース、PCカードやメモリ・スティックを受容するメモリ・カード・インターフェース(カード・スロット)等のような、コンピュータの周辺機器接続用の汎用インターフェースを備え、ローカル接続された外部機器との間でプログラムやデータの移動を行うようにしてもよい。
【0036】
また、インターフェース25の他の例として、赤外線通信(IrDA)インターフェースを備え、外部機器と無線通信を行うようにしてもよい。
【0037】
更に、制御ユニット20は、無線通信インターフェース26やネットワーク・インターフェース・カード(NIC)27等を含み、Bluetoothのような近接無線データ通信や、IEEE 802.11bのような無線ネットワーク、あるいはインターネット等の広域ネットワークを経由して、外部のさまざまなホスト・コンピュータとデータ通信を行うことができる。
【0038】
このようなロボット装置1とホスト・コンピュータ間におけるデータ通信により、遠隔のコンピュータ資源を用いて、ロボット装置1の複雑な動作制御を演算したり、リモート・コントロールしたりすることができる。
【0039】
(B)ロボット装置の行動制御方法
次に、本実施の形態におけるロボット装置の行動制御方法について詳細に説明する。上述したロボット装置1は、自己及び周囲の状況や、使用者からの指示及び働きかけに応じて自律的に行動し得るようになされている。即ち、ロボット装置1は、外部刺激及び内部状態に応じて自律的に行動を選択して発現することができる。本実施の形態におけるロボット装置の行動制御方法では、ロボット装置は、行動に対する行動価値AL(アクティベーションレベル:Activation Level)に基づき選択され発現されることで行動が生成される。ここでは、特に、ロボット装置の行動制御のうち、自身の内部状態と外部からの刺激に対して発現する行動を選択して出力するまでの行動選択制御について説明するが、先ず、行動選択の基準となる行動価値ALの算出方法について説明する。なお、ロボット装置の制御システムの全体の構成についての詳細は後述する。
【0040】
(1)ロボット装置の行動選択
図4は、ロボット装置の制御システムにおいて、各行動に対応する行動価値を算出してこれに基づき行動出力する処理を行う行動選択制御システム部分を示す模式図である。図4に示すように、行動選択制御システム100は、本能や感情といった数種類の情動を数式モデル化して管理する内部状態管理部91と、外部環境におけるセンサ入力等の外部刺激を認識する外部刺激認識部80と、内部状態及び外部刺激に基づき選択されると行動を出力するモジュールである複数の要素行動(図4では、要素行動A乃至Dのみ図示)132と、各要素行動132の行動価値ALを算出する行動価値算出部120と、行動価値ALに基づき、発現する要素行動132を選択する行動選択部130とを有し、選択された要素行動132が行動を出力することでロボット装置が行動を発現するようになされている。
【0041】
要素行動132とは、内部状態及び外部刺激から行動出力を決定するモジュールであり、各モジュール毎にステートマシンを用意しており、それ以前の行動(動作)や状況に依存して、センサ入力された外部情報の認識結果を分類し、動作を機体上で発現する。このモジュール(行動記述モジュール)は、外部刺激や内部状態に応じた状況判断を行ない、行動価値ALを算出するMonitor機能と、行動実行に伴う状態遷移(ステートマシン)を実現するAction機能とを備えたスキーマ(Schema)121として記述されるが、スキーマの詳細については後述する。各要素行動132には、自身に記述された行動に応じて所定の内部状態及び外部刺激が定義されている。
【0042】
ここで外部刺激とは、外部刺激認識部80におけるロボット装置の知覚情報等であり、例えばカメラから入力された画像に対して処理された色情報、形情報、顔情報等の対象物情報等が挙げられる。具体的には、例えば、色、形、顔、3D一般物体、及びハンドジェスチャー、その他、動き、音声、接触、距離、場所、時間、及びユーザとのインタラクション回数等が挙げられる。
【0043】
また、内部状態とは、上述した如く、内部状態管理部91にて管理される本能や感情といった情動であり、例えば、疲れ(FATIGUE)、痛み(PAIN)、栄養状態(NOURISHMENT)、乾き(THURST)、愛情(AFFECTION)、好奇心(CURIOSITY)等がある。
【0044】
そして、例えば行動出力が「食べる」である要素行動Aは、外部刺激として対象物の種類(OBJECT_ID)、対象物の大きさ(OBJECT_SIZEという。)、対象物の距離(OBJECT_DISTANCE)等を扱い、内部状態として「NOURISHMENT」(「栄養状態」)、「FATIGUE」(「疲れ」)等を扱う。このように、各要素行動毎に、扱う外部刺激及び内部状態の種類が定義され、該当する外部刺激及び内部状態に対応する行動(要素行動)に対する行動価値が算出される。なお、1つの内部状態、又は外部刺激は、1つの要素行動だけでなく、複数の要素行動に対応付けられていてもよいことはもちろんである。
【0045】
また、内部状態管理部91は、外部刺激並びに例えば自身のバッテリの残量及びモータの回転角等の情報を入力とし、上述のような複数の内部状態に対応した内部状態の値(内部状態ベクトルIntV)を算出、管理する。具体的には、例えば、内部状態「栄養状態」は、バッテリの残量を基に決定し、内部状態「疲れ」は、消費電力を基に決定することができる。
【0046】
行動価値算出部120は、後述する行動価値算出データベース121を参照し、ある時刻での外部刺激と内部状態とからその時刻での各要素行動A〜Dにおける行動価値ALを算出する。この行動価値算出部120は、本実施の形態においては各要素行動A〜D毎に個別に設けられるものとするが、行動価値算出部120により全ての要素行動についての行動価値を算出するようにしてもよい。
【0047】
行動価値ALとは、その要素行動をロボット装置がどれくらいやりたいか(実行優先度)を示すもので、行動選択部130がこの行動価値ALに基づき、要素行動を選択し、選択された要素行動は自身に記述された行動を出力する。即ち、各要素行動が自身の行動価値算出部120により、行動価値ALの算出を行い、その行動価値ALが例えば最も高い要素行動を行動選択部130が選択する。
【0048】
各要素行動に対する行動価値ALは、現在の各内部状態に対応する各行動に対する欲求値と、現在の各内部状態に基づく満足度と、外部刺激により変化すると予想される内部状態の変化量、即ち、外部刺激が入力され行動を発現した結果、変化すると予想される内部状態の変化量を示す予想内部状態変化に基づく予想満足度変化とに基づき、算出される。
【0049】
ここでは、ある「種類」、「大きさ」の対象物がある「距離」に存在するとき、行動出力が「食べる」である要素行動Aの行動価値ALを、内部状態「栄養状態」、「疲れ」とから算出する例をとって、所定の要素行動Aにおける行動価値ALを算出する方法について具体的に説明する。
【0050】
(2)行動価値算出部
図5は、行動価値算出部120が内部状態及び外部刺激から行動価値ALを算出する処理の流れを示す模式図である。本実施の形態においては、各要素行動毎に、1以上の内部状態を成分として有する内部状態ベクトルIntV(Internal Variable)が定義されており、内部状態管理部91から各要素行動に応じた内部状態ベクトルIntVを得る。即ち、内部状態ベクトルIntVの各成分は、例えば上述した情動等を示す1つの内部状態の値(内部状態パラメータ)を示すもので、内部状態ベクトルIntVが有する各成分に応じた要素行動の行動価値算出に使用される。具体的には、上記行動出力「食べる」を有する要素行動Aは、例えば内部状態ベクトルIntV{IntV_NOURISHMENT「栄養状態」,IntV_FATIGUE「疲れ」}が定義される。
【0051】
また、各内部状態毎に、1以上の外部刺激の値を成分として有する外部刺激ベクトルExStml(External Stimulus)が定義されており、外部刺激認識部80から各内部状態、即ち各要素行動に応じた外部刺激ベクトルExStmlを得る。即ち、外部刺激ベクトルExStmlの各成分は、例えば上述した対象物の大きさ、対象物の種類、対象物までの距離等の認識情報を示すもので、外部刺激ベクトルExStmlが有する各成分に応じた内部状態値の算出に使用される。具体的には、内部状態IntV_NOURISHMENT「栄養状態」には、例えば、外部刺激ベクトルExStml{OBJECT_ID「対象物の種類」,OBJECT_SIZE「対象物の大きさ」}が定義され、内部状態IntV_FATIGUE「疲れ」には、例えば外部刺激ベクトルExStml{OBJECT_DISTANCE「対象物までの距離」}が定義される。
【0052】
行動価値算出部120は、この内部状態ベクトルIntV及び外部刺激ベクトルExStmlを入力とし、行動価値ALを算出する。具体的には、行動価値算出部120は、内部状態ベクトルIntVから、該当する要素行動について、どれだけやりたいかを示すモチベーションベクトル(MotivationVector)を求める第1の算出部MVと、内部状態ベクトルIntV及び外部刺激ベクトルExStmlから、該当する要素行動をやれるか否か示すリリーシングベクトル(ReleasingVector)を求める第2の算出部RVとを有し、これら2つのベクトルから行動価値ALを算出する。
【0053】
(2−1)モチベーションベクトルの算出
行動価値ALを算出する一方の要素であるモチベーションベクトルは、要素行動に定義されている内部状態ベクトルIntVから、その要素行動に対する欲求を示す欲求値ベクトルInsV(Instinct Variable)として求められる。例えば、行動出力「食べる」を有する要素行動Aは、内部状態ベクトルIntV{IntV_NOURISHMENT,IntV_FATIGUE}を有し、これより、欲求値ベクトルInsV{InsV_NOURISHMENT,InsV_FATIGUE}をモチベーションベクトルとして求める。即ち、欲求値ベクトルInsVは、行動価値ALを算出するためのモチベーションベクトルとなる。
【0054】
欲求値ベクトルInsVの計算方法としては、例えば内部状態ベクトルIntVの値が大きいほど、欲求が満たされているものと判断され欲求値は小さくなり、内部状態ベクトルIntVがある値より大きくなると欲求値は負になるような関数を用いることができる。
【0055】
具体的には、下記式(1)及び図6に示すような関数が挙げられる。図6は、横軸に内部状態ベクトルIntVの各成分をとり、縦軸に欲求値ベクトルInsVの各成分をとって、下記式(1)で示される内部状態と欲求値との関係を示すグラフ図である。
【0056】
【数1】
Figure 2004268235
【0057】
欲求値ベクトルInsVは、上記式(1)及び図6に示すように、内部状態ベクトルIntVの値のみで決まる。ここでは、内部状態の大きさを0乃至100とし、そのときの欲求値の大きさが−1乃至1となるような関数を示す。例えば内部状態が8割満たされているときに、欲求値が0となるような内部状態−欲求値曲線L1を設定することで、ロボット装置は、常に内部状態が8割の状態を維持するように行動を選択するようになる。これにより、例えば、内部状態「栄養状態」(IntV_NORISHMENT)に対応する欲求が「食欲」(InsV_NORISFMENT)である場合、お腹が減っていれば食欲が大きくなり、腹八分目以上では食欲がなくなることを示し、これを利用すればそのような情動を表出するような行動を発現させるようにすることができる。
【0058】
上記式(1)における定数A乃至Fを種々変更することで、各内部状態毎に異なる欲求値が求まる。例えば、内部状態が0乃至100の間において、欲求値が1乃至0に変化するようにしてもよいし、また、各内部状態毎に上記式(1)とは異なる内部状態−欲求値関数を用意してもよい。
【0059】
(2−2)リリーシングベクトルの算出
一方、行動価値ALを算出する他方の要素であるリリーシングベクトルは、内部状態ベクトルIntVから求められる満足度ベクトルS(Satisfaction)と、外部刺激ベクトルExStmlから求められる予想満足度変化ベクトルとから算出される。
【0060】
先ず、各要素行動に定義されている内部状態と、この内部状態に定義されている外部刺激とから、行動発現後に得られるであろう内部状態と現在の内部状態との差を示す下記(2)に示す予想内部状態変化ベクトルを求める。
【0061】
【数2】
Figure 2004268235
【0062】
予想内部状態変化ベクトルとは、現在の内部状態ベクトルからの、行動発現後に変化すると予想される変化量を示すもので、行動価値算出部120が参照可能な行動価値算出データベース121の行動価値算出データを参照して求めることができる。行動価値算出データは、外部刺激ベクトルと行動発現後に変化すると予想される予想内部状態変化ベクトルとの対応が記述されたものであり、このデータベースを参照することで、行動価値算出部120は、入力された外部刺激ベクトルに応じた予想内部状態変化ベクトルを取得することができる。
【0063】
なお、行動価値算出データベース121の構成についての詳細は後述する。ここでは、先ず、行動価値算出データベースから予想内部状態変化、予想欲求度変化を求める方法について説明する。
【0064】
行動価値算出データベースに登録される行動価値算出データとしては、図7(a)及び図7(b)に示すものが考えられる。即ち、図7(a)に示すように、内部状態「栄養状態」(「NOURISHMENT」)に関しては、その要素行動の行動出力である「食べる」を発現した結果、対象物の大きさ(OBJECT_SIZE)が大きいほど、また対象物の種類(OBJECT_ID)がOBJECT_ID=0に対応する対象物M1より、OBJECT_ID=1に対応する対象物M2が、また、OBJECT_ID=1に対応する対象物M2より、OBJECT_ID=2に対応する対象物M3の方が内部状態「栄養状態」が満たされる量が大きく、栄養を満たすであろうと予想される場合を示している。
【0065】
また、図7(b)に示すように、内部状態「疲れ」(「FATIGUE」)に関しては、その要素行動の行動出力である「食べる」を発現した結果、対象物の距離「OBJECT_DISTANCE」が大きいほど、内部状態「FATIGUE」が満たされる量が大きく、疲れるであろうと予想される場合を示している。
【0066】
即ち、上述した如く、各行動要素に対して内部状態ベクトルIntV及び外部刺激ベクトルExStmlが定義されているため、外部刺激ベクトルExStmlの各成分として対象物の大きさ及び対象物の種類を有するベクトルが供給された場合、この外部刺激ベクトルExStmlが定義されている内部状態IntV_NOURISHMENT(「栄養状態」)を有する内部状態ベクトルが定義されている要素行動Aの行動結果に対する予想内部状態変化が求められ、対象物の距離を有するベクトルが供給された場合、この外部刺激ベクトルExStmlが定義されている内部状態IntV_FATIGUE(「疲れ」)を有する内部状態ベクトルが定義されている要素行動Aの行動結果に対する予想内部状態変化が求められる。
【0067】
次に、内部状態ベクトルIntVから下記(3)に示す満足度ベクトルSを算出し、上記(2)に示す予想内部状態変化ベクトルから、下記(4)に示す予想満足度変化ベクトルを求める。
【0068】
【数3】
Figure 2004268235
【0069】
【数4】
Figure 2004268235
【0070】
内部状態ベクトルIntVに対する満足度ベクトルSの計算法としては、要素行動Aに定義されている内部状態ベクトル{IntV_NOURISHMENT,IntV_FATIGUE}の各成分IntV_NOURISHMENT「栄養状態」及びIntV_FATIGUE「疲れ」に対して、夫々下記式(5−1)及び(5−2)に示すような関数が考えられる。
【0071】
【数5】
Figure 2004268235
【0072】
図8及び図9は、夫々上記式(5−1)及び(5−2)に示す関数を示すグラフ図である。図8は、横軸にIntV_NOURISHMENT「栄養状態」、縦軸に内部状態「栄養状態」に対する満足度S_NOURISHMENTをとり、図9は、横軸にIntV_FATIGUE「疲れ」、縦軸に内部状態「疲れ」に対する満足度S_FATIGUEをとって、内部状態と満足度との関係を示すグラフ図である。
【0073】
図8に示す関数は、内部状態「栄養状態」の値IntV_NOURISHMENTが0乃至100の値を有し、これに対応する満足度S_NOURISHMENTが0乃至1で全て正の値を有するものであって、内部状態の値が0から80近傍までは満足度が0から増加し、それ以降は減少して内部状態の値が100で再び満足度0になるような曲線L2を示す関数である。即ち、内部状態「栄養状態」に関しては、現在(ある時刻)の内部状態「栄養状態」の値(IntV_NOURISHMENT=40)から計算される満足度S_NOURISHMENT、図7(a)によって得られる内部状態「栄養状態」の予想内部状態変化(40から80までの20)に対応する予想満足度変化は、共に正である。
【0074】
また、上述の図5には関数L2のみを示しているが、図9に示すような関数を用いることもできる。即ち、図9に示す関数は、内部状態「疲れ」の値IntV_FATIGUEが0乃至100の値を有し、これに対応する満足度S_FATIGUEが0乃至−1で全て負の値をするものであって、内部状態が大きくなるほど、満足度が小さくなるような曲線L3を示す関数である。現在の内部状態「疲れ」の内部状態の値から計算される満足度S_FATIGUEは負であり、図7(a)によって得られる内部状態「疲れ」の予想内部状態変化が正であれば、予想満足度変化ベクトルは負になる。
【0075】
上記式(5−1)、(5−2)に示される関数において、各定数A〜Fを可変に設定することで、種々の内部状態に対応して異なる満足度を得るための関数を設定することができる。
【0076】
そして、下記式(6)によって、外部刺激により、行動発現後にどのくらい内部状態を満足させるかの値を決定することで、行動価値ALを算出するための他方の要素であるリリーシングベクトルを求めることができる。
【0077】
【数6】
Figure 2004268235
【0078】
ここで、上記式(6)におけるαが大きいと、リリーシングベクトルは予想満足度変化、即ち、行動を発現した結果、どれくらいの満足度が得られるか、即ちどれくらい満足度が増えるかを示す値に強く依存し、αが小さいと、予想満足度、即ち、行動を発現した結果、満足度がどのくらいになるかを示す値に強く依存するという傾向を有することになる。
【0079】
(2−3)行動価値ALの算出
以上のようにして求められたモチベーションベクトルと、リリーシングベクトルとから、最終的に行動価値ALが下記式(7)のように算出される。
【0080】
【数7】
Figure 2004268235
【0081】
ここで、βが大きいと、行動価値ALは内部状態(欲求値)に強く依存し、βが小さいと外部刺激(予想満足度変化及び予想満足度)に強く依存する傾向を有する。このようにして、内部状態の値(内部状態ベクトルIntV)と外部刺激の値(外部刺激ベクトルExStml)とから欲求値、満足度、予想満足度を計算し、これら欲求値、満足度、予想満足度に基づいて行動価値ALを算出することができる。
【0082】
そして、この行動価値ALに基づいて、行動選択部130が行動を選択することにより、例えば同じ外部刺激が入力された場合であっても、そのときの内部状態の値によって異なる行動が選択される。
【0083】
(2−4)行動価値算出データベース
次に、行動価値算出データベース121の行動価値算出データの構造及び、データベースの参照方法(予想内部状態変化の求め方)について説明する。上述したように、行動価値算出データは、入力された外部刺激に対して予想内部状態変化ベクトルを求めるためのデータであり、各要素行動に定義された内部状態に対して、外部刺激ベクトル空間上に代表点(外部刺激の値)が定義されている。そして、その代表点上に予想される内部状態の変化量を示す予想内部状態変化が定義されている。そして、入力された外部刺激が、定義された外部刺激ベクトル空間の代表点上の値であった場合、予想内部状態変化はその代表点上に定義された値となる。
【0084】
図10(a)及び図10(b)は、行動価値算出データ構造の一例を示すグラフ図である。図10(a)に示すように、内部状態「栄養状態」(「NOURISHMENT」)の予想内部状態変化を求める場合、外部刺激ベクトル空間上の代表点{OBJECT_ID,OBJECT_SIZE}及びこの代表点に対応する予想内部状態変化を例えば下記表1のように定義しておく。
【0085】
【表1】
Figure 2004268235
【0086】
また、図10(b)に示すように、内部状態「疲れ」(「FATIGUE」)の予想内部状態変化ベクトルを求める場合、外部刺激ベクトル空間上の代表点{OBJECT_DISTANCE}及びこの代表点に対応する予想内部状態変化を例えば下記表2のように定義しておく。
【0087】
【表2】
Figure 2004268235
【0088】
このように、予想内部状態変化は、外部刺激ベクトル空間上の代表点にのみ定義されているため、外部刺激の種類(例えば、OBJECT_DISTANCEやOBJECT_SIZE等)によっては、定義された外部刺激ベクトル空間の代表点以外の値が入力されることが考えられる。その場合、予想内部状態変化は、入力された外部刺激の近傍の代表点から線形補間により求めることができる。
【0089】
図11及び図12は、夫々1次元及び2次元の外部刺激の線形補間方法を説明する図である。上述の図10(b)に示すように1つの外部刺激(OBJECT_DISTANCE)から予想内部状態変化を求める場合、即ち、内部状態に1つの外部刺激が定義されている場合、図11に示すように、横軸に外部刺激をとり、縦軸にこの外部刺激に対する予想内部状態変化をとって、外部刺激(OBJECT_DISTANCE)のパラメータである代表点D1及び代表点D2に定義された予想内部状態変化となるような直線L4により、入力される外部刺激Dnの予想内部状態変化量Inを求めることができる。
【0090】
また、図12に示すように、内部状態に対して入力となる外部刺激が2つの成分から外部刺激ベクトルとして、例えば図11に示すOBJECT_DISTANCEに加え、OBJECT_WEIGHTが定義されている場合に、各外部刺激の所定のパラメータである代表点(D1,W1),(D1,W2),(D2,W1),(D2,W2)が定義され、これに対応する予想内部状態変化を有している場合において、上記の4つの代表点とは異なる外部刺激Enm(Dn,Wn)が入力された場合、例えば先ず、OBJECT_DISTANCE=D1において、OBJECT_WEIGHTの代表点W1,W2に定義された予想内部状態変化を通る直線L5を求め、同じく、OBJECT_DISTANCE=D2において、OBJECT_WEIGHTの代表点W1,W2に定義された予想内部状態変化を通る直線L6を求める。そして、入力される外部刺激Enmの2つの入力のうち、例えばWnに対応する2つの直線L5及びL6における予想内部状態変化を求め、更にこの2つの予想内部状態変化を結んだ直線L7を求め、この直線L7において入力される外部刺激Enmの他方の外部刺激Dnに対応する予想内部状態変化を求めることで、外部刺激Enmに対応した予想内部状態変化量Inmを線形補間により求めることができる。
【0091】
(2−5)行動価値算出方法
次に、図5に示す行動価値算出部120における行動価値算出方法について、図13に示すフローチャートを参照して説明する。
【0092】
図13に示すように、先ず、図4に示す外部刺激認識部80により外部刺激が認識されると、これが行動価値算出部120に供給される。この際、例えば外部刺激認識部80からの通知により、内部状態管理部91から各内部状態が供給されるようになされている(ステップS1)。
【0093】
次に、上述したように、供給された各内部状態から、例えば上記式(1)等の関数を使用して対応する欲求値を算出することで、内部状態ベクトルIntVからモチベーションベクトルとなる欲求値ベクトルを算出する(ステップS2)。
【0094】
また、行動価値算出部120は、供給された各内部状態から上記式(5−1),(5−2)等の関数を使用して対応する満足度を算出することで、内部状態ベクトルIntVから、満足度ベクトルSを算出する(ステップS3)。
【0095】
一方、供給された外部刺激(外部刺激ベクトル)から、上述したように、行動を発現した結果、得られると予想される予想内部状態変化を求める(ステップS4)。そして、ステップS3と同様の関数を用いて、この予想内部状態変化に対応する予想満足度変化を求め(ステップS5)、得られた予想満足度変化と、ステップS3で求めた満足度ベクトルとから上記式(6)により、リリーソングベクトルを算出する(ステップS6)。
【0096】
最後に、ステップS2にて求めたモチベーションベクトルと、ステップS6にて求めたリリーシングベクトルとから、上記式(7)より行動価値ALを算出する。
【0097】
なお、上記ステップS1乃至ステップS7における行動価値算出部120における行動価値ALの算出は、外部刺激を認識する毎に行うものとして説明したが、例えば所定のタイミングで行動価値を算出するようにしてもよい。また、外部刺激が認識され、行動価値算出が行われる際は、認識された外部刺激に関する内部状態についての欲求値及び満足度のみを算出するようにしてもよいし、全ての内部状態について欲求値及び満足度を算出するようにしてもよい。
【0098】
本実施の形態においては、内部状態及び外部刺激に基づいて行動価値ALを算出することにより、行動価値ALを算出してこれに基づき行動を選択することにより、エンターテインメントロボット装置としてユーザを飽きさせない行動を発現させることができる。
【0099】
また、センサから入力される外部刺激の値にはノイズ等の原因で、代表点以外の値が入力されることがある。そのような場合でも、予想内部状態変化量の計算を線形補間法で行うことにより、代表点からの離れ度合いに比例して、近傍代表点の予想内部状態変化量を更新することができると共に少ない計算量で予想内部状態変化量を求めることができる。
【0100】
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。例えば、上述の行動価値算出データベースを更新する学習手段を設けることができる。即ち、学習手段を設けて、行動価値算出データにおける内部状態変化ベクトルから予想内部状態変化ベクトルを学習してもよい。
【0101】
(3)行動価値算出データベースの学習
以下では、このような行動価値算出データにおける予想内部状態変化ベクトルを、行動発現後の内部状態変化ベクトルから学習する学習方法について説明する。行動価値算出データベースにおけるデータベースの学習手段を設けることで、行動価値算出データベースがユーザとのインタラクションや、外部環境に応じて随時更新され、従って、ロボット装置の学習結果によっては、同じ外部刺激を受けても異なる行動を発現する等、更にユーザを飽きさせない行動生成が実現される。このような行動価値算出データの学習を行うためには教師信号が必要であるが、例えば行動結果から決定される実際の内部状態変化量を教師信号として、外部刺激に対する予想内部状態変化を学習することができる。
【0102】
図14は、外部刺激が入力されてから行動価値算出データベースの学習を行うまでの流れを示す模式図である。上述の図5に示した如く、行動価値算出データベース121を参照して、予想した予測内部状態変化ベクトルを生徒信号とし、行動価値ALを算出し、この値に基づき、例えば行動価値ALが最も大きい要素行動を行動選択部が選択する。選択された要素行動は、行動を出力し、ロボット装置は行動を発現する。
【0103】
ロボット装置が実際に行動を発現した結果、図4に示す内部状態管理部91は、自身の内部状態を変化させる。即ち、例えば行動発現後の時間経過に応じて内部状態を変更したり、行動の結果に応じて内部状態を変更する。具体的には、例えば、上述したように、内部状態「栄養状態」はバッテリの残量を基に決定され、内部状態「疲れ」は消費電力を基に決定されるものとすると、行動を発現した結果、バッテリの残量が減少することで内部状態「栄養状態」も減少し、また、行動を発現することにより消費された消費電力量の大きさに比例して内部状態「疲れ」が増大する等が挙げられる。
【0104】
こうして実際に行動を発現した結果、ロボット装置の内部状態が変化し、実際の行動発現前後の内部状態の変化量を求めることができる。そして、図14に示すように、行動発現後に得られた内部状態変化ベクトルdIntVが教師信号となり、学習部140にて行動発現前に予想される予想内部状態変化ベクトルの学習が行われ、行動価値算出データベース121が学習に応じて更新される。
【0105】
ここで入力された外部刺激が代表点上の値であるか否かで学習方法が異なる。先ず、ある選択された要素行動において、行動価値を算出するにあたって必要とした外部刺激が、代表点上の値であった場合、下記式(8)によって実際の内部状態変化量をもとに代表点上の予想内部状態変化を更新する。
【0106】
【数8】
Figure 2004268235
【0107】
また、ある選択された要素行動において、行動価値を算出するにあたって必要とした外部刺激が代表点以外の値の場合、外部刺激近傍の代表点、即ち、線形補間に使用した代表点における予想内部状態変化が学習対象となる。各外部刺激について、外部刺激と代表点までの距離の比が上記式(8)に乗じられ、予想内部状態変化を更新する。
【0108】
図15及び図16は、1次元及び2次元外部刺激の予想内部状態変化の更新例を説明する模式図である。図15に示すように、外部刺激Dnが入力され、外部刺激Dnが代表点上にない場合は、上述したように、外部刺激Dn近傍の代表点D1,D2を使用して線形補間されることで行動発現前の予想内部状態変化Inが求められる。そして、行動発現後に、実際の内部状態変化量(dIntV_Fatigure)が求められ、代表点D1,D2と外部刺激Dnとの間の距離と学習率γとから、代表点D1,D2における予想内部状態変化の学習が行われ、下記式(9−1)及び(9−2)に従って夫々代表点D1及びD2の予想内部状態変化が更新される。
【0109】
【数9】
Figure 2004268235
【0110】
また、2つの外部刺激が入力される場合も上述したように、線形補間により行動発現前の外部刺激Enm(Dn,Wn)に対応する予想内部状態変化量Inmを求める際に使用した、入力される外部刺激の近傍の代表点(D1,W1)(D1,W2)、(D2,W1)、(D2,W2)に対応する予想内部状態変化が、下記式(10−1)乃至(10−4)により学習され更新される。即ち、行動発現後に求められる実際の内部状態変化ベクトル、代表点と外部刺激との距離及び学習率αにより、学習が行われ、各代表点に対応する予想内部状態変化が更新される。
【0111】
【数10】
Figure 2004268235
【0112】
(4)行動価値算出データベースの学習方法
次に、図14に示す学習部140により、発現された行動に応じて行動価値算出データベースを更新する方法について、図17に示すフローチャートを参照して説明する。
【0113】
先ず、図4に示す行動価値算出部120により算出された行動価値ALに基づき、図17に示すように、行動選択部130が例えば全ての要素行動に対する行動価値算出結果をモニタし、例えば最も行動価値ALが高い要素行動を選択することで、当該要素行動から行動が出力される(ステップS8)。
【0114】
ロボット装置は、行動を発現することによって例えばバッテリの残量が変化し、これに基づき算出される内部状態が行動前に比べて変化する。また、行動を発現した際に使用された消費電力等に基づき算出される内部状態が行動発現前に比べて変化する。図4に示す内部状態管理部91は、このような行動前後の内部状態の変化を算出し、学習部140に供給する(ステップS9)。学習部140は、上述したように、行動前後の内部状態の実際の変化と、行動価値算出データベースに保存されている予想内部状態変化とから、上記式(9−1),(9−2)又は(10−1)乃至(10−4)により、新しく予想内部状態変化を算出し、行動価値算出データベースを更新する(ステップS10)。
【0115】
このように、学習手段を設けて実際の内部状態変化量を予想内部状態変化量にフィードバックさせて学習を行うことにより、環境やユーザとのインタラクションの結果を行動選択に反映させることができる。
【0116】
(5)ロボット装置の制御システム
次に、上述した行動価値ALを算出して行動を出力する処理を行う行動選択制御システムをロボット装置の制御システムに適応した具体例について詳細に説明する。図18は、上述の行動選択制御システム100を含む制御システム10の機能構成を示す模式図である。本具体例におけるロボット装置1は、上述したように、外部刺激の認識結果や内部状態の変化に応じて、行動制御を行なうことができるものである。更には、長期記憶機能を備え、外部刺激から内部状態の変化を連想記憶することにより、外部刺激の認識結果や内部状態の変化に応じて行動制御を行うことができる。
【0117】
即ち、上述したように、例えば、図2に示すカメラ15から入力された画像に対して処理された色情報、形情報、顔情報等であり、より具体的には、色、形、顔、3D一般物体、ハンドジェスチャー、動き、音声、接触、匂い、味等の構成要素からなる外部刺激と、ロボット装置の身体に基づいた本能や感情等の情動を指す内部状態とに応じて行動価値ALを算出し、行動を選択(生成)し、発現する。
【0118】
内部状態の本能的要素は、例えば、疲れ(fatigue)、熱あるいは体内温度(temperature)、痛み(pain)、食欲あるいは飢え(hunger)、乾き(thirst)、愛情(affection)、好奇心(curiosity)、排泄(elimination)又は性欲(sexual)のうちの少なくとも1つである。また、情動的要素は、幸せ(happiness)、悲しみ(sadness)、怒り(anger)、驚き(surprise)、嫌悪(disgust)、恐れ(fear)、苛立ち(frustration)、退屈(boredom)、睡眠(somnolence)、社交性(gregariousness)、根気(patience)、緊張(tense)、リラックス(relaxed)、警戒(alertness)、罪(guilt)、悪意(spite)、誠実さ(loyalty)、服従性(submission)又は嫉妬(jealousy)等が挙げられる。
【0119】
図示の制御システム10には、オブジェクト指向プログラミングを採り入れて実装することができる。この場合、各ソフトウェアは、データとそのデータに対する処理手続きとを一体化させた「オブジェクト」というモジュール単位で扱われる。また、各オブジェクトは、メッセージ通信と共有メモリを使ったオブジェクト間通信方法によりデータの受け渡しとInvokeを行なうことができる。
【0120】
行動制御システム10は、外部環境(Environments)70を認識するために、視覚認識機能部81、聴覚認識機能部82、及び接触認識機能部83等からなる機能モジュールである上述の図4に示す外部刺激認識部80を備えている。
【0121】
視覚認識機能部(Video)81は、例えば、CCD(Charge Coupled Device:電荷結合素子)カメラのような画像入力装置を介して入力された撮影画像を基に、顔認識や色認識等の画像認識処理や特徴抽出を行う。
【0122】
また、聴覚認識機能部(Audio)82は、マイク等の音声入力装置を介して入力される音声データを音声認識して、特徴抽出したり、単語セット(テキスト)認識を行ったりする。
【0123】
更に、接触認識機能部(Tactile)83は、例えば機体の頭部等に内蔵された接触センサによるセンサ信号を認識して、「なでられた」とか「叩かれた」という外部刺激を認識する。
【0124】
内部状態管理部(ISM:Internal Status Manager)91は、本能や感情といった数種類の情動を数式モデル化して管理しており、上述の視覚認識機能部81、聴覚認識機能部82、及び接触認識機能部83によって認識された外部刺激(ES:ExternalStimula)に応じてロボット装置1の本能や情動といった内部状態を管理する。
【0125】
感情モデル及び本能モデル(感情・本能モデル)は、それぞれ認識結果と行動履歴を入力に持ち、夫々感情値と本能値を管理している。行動モデルは、これら感情値や本能値を参照することができる。
【0126】
また、外部刺激の認識結果や内部状態の変化に応じて行動制御を行なうために、時間の経過とともに失われる短期的な記憶を行なう短期記憶部(STM:Short Term Memory)92と、情報を比較的長期間保持するための長期記憶部(LTM:Long Term Memory)93を備えている。短期記憶と長期記憶という記憶メカニズムの分類は神経心理学に依拠する。
【0127】
短期記憶部92は、上述の視覚認識機能部81、聴覚認識機能部82及び接触認識機能部83によって外部環境から認識されたターゲットやイベントを短期間保持する機能モジュールである。例えば、図2に示すカメラ15からの入力画像を約15秒程度の短い期間だけ記憶する。
【0128】
長期記憶部93は、物の名前等学習により得られた情報を長期間保持するために使用される。長期記憶部93は、例えば、ある行動記述モジュールにおいて外部刺激から内部状態の変化を連想記憶することができる。
【0129】
また、本ロボット装置1の行動制御は、反射行動部(Reflexive Situated Behaviors Layer)103によって実現される「反射行動」と、状況依存行動階層(SBL:Situated Behaviors Layer)102によって実現される「状況依存行動」と、熟考行動階層(Deliberative Layer)101によって実現される「熟考行動」に大別される。
【0130】
反射行動部103は、上述の視覚認識機能部81、聴覚認識機能部82、及び接触認識機能部83によって認識された外部刺激に応じて反射的な機体動作を実現する機能モジュールである。反射行動とは、基本的に、センサ入力された外部情報の認識結果を直接受けて、これを分類して、出力行動を直接決定する行動のことである。例えば、人間の顔を追いかけたり、うなずいたりといった振る舞いは反射行動として実装することが好ましい。
【0131】
状況依存行動階層102は、短期記憶部92及び長期記憶部93の記憶内容や、内部状態管理部91によって管理される内部状態を基に、ロボット装置1が現在置かれている状況に即応した行動を制御する。
【0132】
この状況依存行動階層102は、各行動(要素行動)毎にステートマシンを用意しており、それ以前の行動や状況に依存して、センサ入力された外部情報の認識結果を分類して、行動を機体上で発現する。また、状況依存行動階層102は、内部状態をある範囲に保つための行動(「ホメオスタシス行動」とも呼ぶ)も実現し、内部状態が指定した範囲内を越えた場合には、その内部状態を当該範囲内に戻すための行動が出現し易くなるようにその行動を活性化させる(実際には、内部状態と外部環境の両方を考慮した形で行動が選択される)。状況依存行動は、反射行動に比し、反応時間が遅い。この状況依存行動階層102が上述した図4に示す行動選択制御システム100における要素行動132、行動価値算出部120、行動選択部130に相当し、上述した如く、内部状態と外部刺激とから行動価値ALを算出し、これに基づき行動出力を行う。
【0133】
熟考行動階層101は、短期記憶部92及び長期記憶部93の記憶内容に基づいて、ロボット装置1の比較的長期にわたる行動計画等を行う。熟考行動とは、与えられた状況あるいは人間からの命令により、推論やそれを実現するための計画を立てて行われる行動のことである。例えば、ロボット装置の位置と目標の位置から経路を探索することは熟考行動に相当する。このような推論や計画は、ロボット装置1がインタラクションを保つための反応時間よりも処理時間や計算負荷を要する(すなわち処理時間がかかる)可能性があるので、上記の反射行動や状況依存行動がリアルタイムで反応を返しながら、熟考行動は推論や計画を行う。
【0134】
熟考行動階層101、状況依存行動階層102、及び反射行動部103は、ロボット装置1のハードウェア構成に非依存の上位のアプリケーション・プログラムとして記述することができる。これに対し、ハードウェア依存層制御部(Configuration Dependent Actions And Reactions)104は、これら上位アプリケーション、即ち、行動記述モジュール(スキーマ)からの命令に応じて、関節アクチュエータの駆動等の機体のハードウェア(外部環境)を直接操作する。このような構成により、ロボット装置1は、制御プログラムに基づいて自己及び周囲の状況を判断し、使用者からの指示及び働きかけに応じて自律的に行動できる。
【0135】
次に、行動制御システム10について更に詳細に説明する。図19は、本具体例における行動制御システム10のオブジェクト構成を示す模式図である。
【0136】
図19に示すように、視覚認識機能部81は、Face Detector114、Mulit Color Tracker113、Face Identify115という3つのオブジェクトで構成される。
【0137】
Face Detector114は、画像フレーム中から顔領域を検出するオブジェクトであり、検出結果をFace Identify115に出力する。Mulit Color Tracker113は、色認識を行うオブジェクトであり、認識結果をFace Identify115及びShort Term Memory(STM)92に出力する。また、Face Identify115は、検出された顔画像を手持ちの人物辞書で検索する等して人物の識別を行ない、顔画像領域の位置、大きさ情報とともに人物のID情報をSTM92に出力する。
【0138】
聴覚認識機能部82は、Audio Recog111とSpeech Recog112という2つのオブジェクトで構成される。Audio Recog111は、マイク等の音声入力装置からの音声データを受け取って、特徴抽出と音声区間検出を行うオブジェクトであり、音声区間の音声データの特徴量及び音源方向をSpeech Recog112やSTM92に出力する。Speech Recog112は、Audio Recog111から受け取った音声特徴量と音声辞書及び構文辞書を使って音声認識を行うオブジェクトであり、認識された単語のセットをSTM92に出力する。
【0139】
触覚認識記憶部83は、接触センサからのセンサ入力を認識するTactile Sensor119というオブジェクトで構成され、認識結果はSTM92や内部状態を管理するオブジェクトであるInternal State Model(ISM)91に出力する。
【0140】
STM92は、短期記憶部を構成するオブジェクトであり、上述の認識系の各オブジェクトによって外部環境から認識されたターゲットやイベントを短期間保持(例えばカメラ15からの入力画像を約15秒程度の短い期間だけ記憶する)する機能モジュールであり、STMクライアントであるSBL102に対して外部刺激の通知(Notify)を定期的に行なう。
【0141】
LTM93は、長期記憶部を構成するオブジェクトであり、物の名前等学習により得られた情報を長期間保持するために使用される。LTM93は、例えば、ある行動記述モジュール(スキーマ)において外部刺激から内部状態の変化を連想記憶することができる。
【0142】
ISM91は、内部状態管理部を構成するオブジェクトであり、本能や感情といった数種類の情動を数式モデル化して管理しており、上述の認識系の各オブジェクトによって認識された外部刺激(ES:External Stimula)に応じてロボット装置1の本能や情動といった内部状態を管理する。
【0143】
SBL102は状況依存型行動階層を構成するオブジェクトである。SBL102は、STM92のクライアント(STMクライアント)となるオブジェクトであり、STM92からは定期的に外部刺激(ターゲットやイベント)に関する情報の通知(Notify)を受け取ると、スキーマ(Schema)すなわち実行すべき行動記述モジュールを決定する(後述)。
【0144】
ReflexiveSBL(Situated Behaviors Layer)103は、反射的行動部を構成するオブジェクトであり、上述した認識系の各オブジェクトによって認識された外部刺激に応じて反射的・直接的な機体動作を実行する。例えば、人間の顔を追いかけたり、うなずく、障害物の検出により咄嗟に避けるといった振る舞いを行なう。
【0145】
SBL102は外部刺激や内部状態の変化等の状況に応じた動作を選択する。これに対し、ReflexiveSBL103は、外部刺激に応じて反射的な動作を選択する。これら2つのオブジェクトによる行動選択は独立して行なわれるため、互いに選択された行動記述モジュール(スキーマ)を機体上で実行する場合に、ロボット装置1のハードウェア・リソースが競合して実現不可能なこともある。RM(Resource Manager)116というオブジェクトは、SBL102とReflexiveSBL103とによる行動選択時のハードウェアの競合を調停する。そして、調停結果に基づいて機体動作を実現する各オブジェクトに通知することにより機体が駆動する。
【0146】
Sound Performer172、Motion Controller173、LEDController174は、機体動作を実現するオブジェクトである。Sound Performer172は、音声出力を行うためのオブジェクトであり、RM116経由でSBL102から与えられたテキスト・コマンドに応じて音声合成を行い、ロボット装置1の機体上のスピーカから音声出力を行う。また、Motion Controller173は、機体上の各関節アクチュエータの動作を行なうためのオブジェクトであり、RM116経由でSBL102から手や脚等を動かすコマンドを受けたことに応答して、該当する関節角を計算する。また、LEDController174は、LED19の点滅動作を行なうためのオブジェクトであり、RM116経由でSBL102からコマンドを受けたことに応答してLED19の点滅駆動を行なう。
【0147】
(5−1)状況依存行動制御
次に、上述の具体例において説明したように、行動価値ALを算出し、発現する行動を選択する状況依存行動階層について更に詳細に説明する。図20には、状況依存行動階層(SBL)(但し、反射行動部を含む)による状況依存行動制御の形態を模式的に示している。視覚認識機能部81、聴覚認識機能部82、及び接触認識機能部83からなる外部刺激認識部80における外部環境70の認識結果(センサ情報)182は、外部刺激183として状況依存行動階層(反射行動部103を含む)102aに与えられる。また、外部刺激認識部80による外部環境70の認識結果に応じた内部状態の変化184も状況依存行動階層102aに与えられる。そして、状況依存行動階層102aでは、外部刺激183や内部状態の変化184に応じて状況を判断して、行動選択を実現することができる。状況依存行動階層102aでは、上述した如く、外部刺激183や内部状態の変化184によって各行動記述モジュール(スキーマ)の行動価値ALを算出して、行動価値ALの大きさに応じてスキーマを選択して行動(動作)を実行する。行動価値ALの算出には、例えばライブラリを利用することにより、すべてのスキーマについて統一的な計算処理を行なうことができる。ライブラリには、例えば上述したように、内部状態ベクトルから欲求ベクトルを算出する関数、内部状態ベクトルから満足度ベクトルを算出する関数、及び外部刺激から予想内部状態変化ベクトルを予想するための行動評価データベース等が保存されている。
【0148】
(5−2)スキーマ
図21には、状況依存行動階層102が複数のスキーマ132によって構成されている様子を模式的に示している。状況依存行動階層102は、上述した要素行動として、行動記述モジュールを有し、各行動記述モジュール毎にステートマシンを用意しており、それ以前の行動(動作)や状況に依存して、センサ入力された外部情報の認識結果を分類し、動作を機体上で発現する。要素行動となる行動記述モジュールは、外部刺激や内部状態に応じた状況判断を行なうMonitor機能と、行動実行に伴う状態遷移(ステートマシン)を実現するAction機能とを備えたスキーマ(Schema)132として記述される。
【0149】
状況依存行動階層102b(より厳密には、状況依存行動階層102のうち、通常の状況依存行動を制御する階層)は、複数のスキーマ132が階層的に連結されたツリー構造として構成され、外部刺激や内部状態の変化に応じてより最適なスキーマ132を統合的に判断して行動制御を行なうようになっている。このツリー131は、例えば動物行動学的(Ethological)な状況依存行動を数式化した行動モデルや、感情表現を実行するためのサブツリー等、複数のサブツリー(又は枝)を含んでいる。
【0150】
図22には、状況依存行動階層102におけるスキーマのツリー構造を模式的に示している。同図に示すように、状況依存行動階層102は、短期記憶部92から外部刺激の通知(Notify)を受けるルート・スキーマ201、202、203を先頭に、抽象的な行動カテゴリから具体的な行動カテゴリに向かうように、各階層毎にスキーマが配設されている。例えば、ルート・スキーマの直近下位の階層では、「探索する(Investigate)」、「食べる(Ingestive)」、「遊ぶ(Play)」というスキーマ201、202、203が配設される。そして、スキーマ201「探索する(Investigate)」の下位には、「InvestigativeLocomotion」、「HeadinAirSniffing」、「InvestigativeSniffing」というより具体的な探索行動を記述した複数のスキーマ201が配設されている。同様に、スキーマ202「食べる(Ingestive)」の下位には「Eat」や「Drink」等のより具体的な飲食行動を記述した複数のスキーマ202が配設され、スキーマ203「遊ぶ(Play)」の下位には「PlayBowing」、「PlayGreeting」、「PlayPawing」等のより具体的な遊ぶ行動を記述した複数のスキーマ203が配設されている。
【0151】
図示の通り、各スキーマは外部刺激183と内部状態(の変化)184を入力している。また、各スキーマは、少なくともMonitor関数とActionと関数を備えている。
【0152】
ここで、Monitor関数とは、外部刺激183と内部状態184に応じて当該スキーマの行動価値ALを算出する関数であり、各スキーマは、このような行動価値算出手段としてのMonitor機能を有する。図22に示すようなツリー構造を構成する場合、上位(親)のスキーマは外部刺激183と内部状態184を引数として下位(子供)のスキーマのMonitor関数をコールすることができ、子供のスキーマは行動価値ALを返り値とする。また、スキーマは自分の行動価値ALを算出するために、更に子供のスキーマのMonitor関数をコールすることができる。そして、ルートのスキーマには各サブツリーからの行動価値ALが返されるので、外部刺激と内部状態の変化に応じた最適なスキーマすなわち行動を統合的に判断することができる。ここで、ルート・スキーマを上述の行動選択部とし、これにより、スキーマを選択するようにしてもよい。なお、例えば後述するリソース・マネージャRM116や、別に設けた行動選択部により、各スキーマの行動価値ALを観察し、各行動価値ALの値に基づき行動を選択してもよいことはもちろんである。
【0153】
行動選択部では、上述したように、例えば行動価値ALが最も高いスキーマを選択したり、行動価値ALが所定の閾値を越えた2以上のスキーマを選択して並列的に行動実行するようにしてもよい(但し、並列実行するときは各スキーマどうしでハードウェア・リソースの競合がないことを前提とする)。
【0154】
また、Action関数は、スキーマ自身が持つ行動を記述したステートマシンを備えている。図22に示すようなツリー構造を構成する場合、親スキーマは、Action関数をコールして、子供スキーマの実行を開始したり中断させたりすることができる。本具体例では、ActionのステートマシンはReadyにならないと初期化されない。言い換えれば、中断しても状態はリセットされず、スキーマが実行中の作業データを保存することから、中断再実行が可能である。
【0155】
図23には、状況依存行動階層102において通常の状況依存行動を制御するためのメカニズムを模式的に示している。
【0156】
同図に示すように、状況依存行動階層(SBL)102には、短期記憶部(STM)92から外部刺激183が入力(Notify)されるとともに、内部状態管理部91から内部状態の変化184が入力される。状況依存行動階層102は、例えば動物行動学的(Ethological)な状況依存行動を数式化した行動モデルや、感情表現を実行するためのサブツリー等、複数のサブツリーで構成されており、ルート・スキーマは、外部刺激183の通知(Notify)に応答して、各サブツリーのMonitor関数をコールし、その返り値としての行動価値ALを参照して、統合的な行動選択を行ない、選択された行動を実現するサブツリーに対してAction関数をコールする。また、状況依存行動階層102において決定された状況依存行動は、リソース・マネージャRM116により反射行動部103による反射的行動とのハードウェア・リソースの競合の調停を経て、機体動作(Motion Controller)に適用される。
【0157】
また、反射的行動部103は、上述した認識系の各オブジェクトによって認識された外部刺激183に応じて、例えば、障害物の検出により咄嗟に避ける等、反射的・直接的な機体動作を実行する。このため、図22に示す通常の状況依存行動を制御する場合とは相違し、図21に示すように、認識系の各オブジェクトからの信号を直接入力する複数のスキーマ133が階層化されずに並列的に配置されている。
【0158】
図24には、反射行動部103におけるスキーマの構成を模式的に示している。同図に示すように、反射行動部103には、聴覚系の認識結果に応答して動作するスキーマとしてAvoid Big Sound204、Face to Big Sound205及びNodding Sound209、視覚系の認識結果に応答して動作するスキーマとしてFace to Moving Object206及びAvoid Moving Object207、並びに、触覚系の認識結果に応答して動作するスキーマとして手を引っ込める208が、それぞれ対等な立場で(並列的に)配設されている。
【0159】
図示の通り、反射的行動を行なう各スキーマは外部刺激183を入力に持つ。また、各スキーマは、少なくともMonitor関数とAction関数を備えている。Monitor関数は、外部刺激183に応じて当該スキーマの行動価値ALを算出して、これに応じて該当する反射的行動を発現すべきかどうかが判断される。また、Action関数は、スキーマ自身が持つ反射的行動を記述したステートマシン(後述)を備えており、コールされることにより、該当する反射的行動を発現するとともにActionの状態を遷移させていく。
【0160】
図25には、反射行動部103において反射的行動を制御するためのメカニズムを模式的に示している。図24にも示したように、反射行動部103内には、反応行動を記述したスキーマや、即時的な応答行動を記述したスキーマが並列的に存在している。認識系の機能モジュール80を構成する各オブジェクトから認識結果が入力されると、対応する反射行動スキーマがAonitor関数により行動価値ALを算出し、その値に応じてActionを軌道すべきかどうかが判断される。そして、反射行動部103において起動が決定された反射的行動は、リソース・マネージャRM116により状況依存行動階層102による状況依存行動とのハードウェア・リソースの競合の調停を経て、機体動作(Motion Controller173)に適用される。
【0161】
このような状況依存行動階層102及び反射行動部103を構成するスキーマは、例えばC++言語ベースで記述される「クラス・オブジェクト」として記述することができる。図26には、状況依存行動階層102において使用されるスキーマのクラス定義を模式的に示している。同図に示されている各ブロックはそれぞれ1つのクラス・オブジェクトに相当する。
【0162】
図示の通り、状況依存行動階層(SBL)102は、1以上のスキーマと、SBL102の入出力イベントに対してIDを割り振るEvent Data Handler(EDH)211と、SBL102内のスキーマを管理するSchema Handler(SH)212と、外部オブジェクト(STMやLTM、リソース・マネージャ、認識系の各オブジェクト等)からデータを受信する1以上のReceive Data Handler(RDH)213と、外部オブジェクトにデータを送信する1以上のSend Data Handler(SDH)214とを備えている。
【0163】
Schema Handler212は、状況依存行動階層(SBL)102や反射行動部103を構成する各スキーマやツリー構造等の情報(SBLのコンフィギュレーション情報)をファイルとして保管している。例えばシステムの起動時等に、Schema Handler212は、このコンフィギュレーション情報ファイルを読み込んで、図22に示したような状況依存行動階層102のスキーマ構成を構築(再現)して、メモリ空間上に各スキーマのエンティティをマッピングする。
【0164】
各スキーマは、スキーマのベースとして位置付けられるOpenR_Guest215を備えている。OpenR_Guest215は、スキーマが外部にデータを送信するためのDsubject216、並びに、スキーマが外部からデータを受信するためのDObject217というクラス・オブジェクトをそれぞれ1以上備えている。例えば、スキーマが、SBL102の外部オブジェクト(STMやLTM、認識系の各オブジェクト等)にデータを送るときには、Dsubject216はSend Data Handler214に送信データを書き込む。また、DObject217は、SBL102の外部オブジェクトから受信したデータをReceive Data Handler213から読み取ることができる。
【0165】
Schema Manager218及びSchema Base219は、ともにOpenR_Guest215を継承したクラス・オブジェクトである。クラス継承は、元のクラスの定義を受け継ぐことであり、この場合、OpenR_Guest215で定義されているDsubject216やDObject217等のクラス・オブジェクトをSchema Manager Base218やSchema Base219も備えていることを意味する(以下、同様)。例えば図22に示すように複数のスキーマがツリー構造になっている場合、Schema Manager Base218は、子供のスキーマのリストを管理するクラス・オブジェクトSchema List220を持ち(子供のスキーマへのポインタを持ち)、子供スキーマの関数をコールすることができる。また、Schema Base219は、親スキーマへのポインタを持ち、親スキーマからコールされた関数の返り値を戻すことができる。
【0166】
Schema Base219は、State Machine221及びPronome222という2つのクラス・オブジェクトを持つ。State Machine221は当該スキーマの行動(Action関数)についてのステートマシンを管理している。親スキーマは子供スキーマのAction関数のステートマシンを切り替える(状態遷移させる)ことができる。また、Pronome222には、当該スキーマが行動(Action関数)を実行又は適用するターゲットを代入する。後述するように、スキーマはPronome222に代入されたターゲットによって占有され、行動(動作)が終了(完結、異常終了等)するまでスキーマは解放されない。新規のターゲットのために同じ行動を実行するためには同じクラス定義のスキーマをメモリ空間上に生成する。この結果、同じスキーマをターゲット毎に独立して実行することができ(個々のスキーマの作業データが干渉し合うことはなく)、後述する行動のReentrance性が確保される。
【0167】
Parent Schema Base223は、Schema Manager218及びSchema Base219を多重継承するクラス・オブジェクトであり、スキーマのツリー構造において、当該スキーマ自身についての親スキーマ及び子供スキーマすなわち親子関係を管理する。
【0168】
Intermediate Parent Schema Base224は、Parent Schema Base223を継承するクラス・オブジェクトであり、各クラスのためのインターフェース変換を実現する。また、Intermediate Parent Schema Base224は、Schema Status Info225を持つ。このSchema Status Info225は、当該スキーマ自身のステートマシンを管理するクラス・オブジェクトである。親スキーマは、子供スキーマのAction関数をコールすることによってそのステートマシンの状態を切り換えることができる。また、子供スキーマのMonitor関数をコールしてそのステートマシンの常態に応じた行動価値ALを問うことができる。但し、スキーマのステートマシンは、前述したAction関数のステートマシンとは異なるということを留意されたい。
【0169】
And Parent Schema226、Num Or Parent Schema227、Or Parent Schema228は、Intermediate Parent Schema Base224を継承するクラス・オブジェクトである。And Parent Schema226は、同時実行する複数の子供スキーマへのポインタを持つ。Or Parent Schema228は、いずれか択一的に実行する複数の子供スキーマへのポインタを持つ。また、Num Or Parent Schema227は、所定数のみを同時実行する複数の子供スキーマへのポインタを持つ。
【0170】
Parent Schema229は、これらAnd Parent Schema226、Num Or Parent Schema227、Or Parent Schema228を多重継承するクラス・オブジェクトである。
【0171】
図27には、状況依存行動階層(SBL)102内のクラスの機能的構成を模式的に示している。状況依存行動階層(SBL)102は、STMやLTM、リソース・マネージャ、認識系の各オブジェクト等外部オブジェクトからデータを受信する1以上のReceive Data Handler(RDH)213と、外部オブジェクトにデータを送信する1以上のSend Data Handler(SDH)214とを備えている。
【0172】
Event Data Handler(EDH)211は、SBL102の入出力イベントに対してIDを割り振るためのクラス・オブジェクトであり、RDH213やSDH214から入出力イベントの通知を受ける。
【0173】
Schema Handler212は、スキーマを管理するためのクラス・オブジェクトであり、SBL102を構成するスキーマのコンフィギュレーション情報をファイルとして保管している。例えばシステムの起動時等に、Schema Handler212は、このコンフィギュレーション情報ファイルを読み込んで、SBL102内のスキーマ構成を構築する。
【0174】
各スキーマは、図26に示したクラス定義に従って生成され、メモリ空間上にエンティティがマッピングされる。各スキーマは、OpenR_Guest215をベースのクラス・オブジェクトとし、外部にデータ・アクセスするためのDSubject216やDObject217等のクラス・オブジェクトを備えている。
【0175】
スキーマが主に持つ関数とステートマシンを以下に示しておく。以下の関数は、Schema Base219で記述されている。
ActivationMonitor():スキーマがReady時にActiveになるための評価関数
Actions():Active時の実行用ステートマシン
Goal():Active時にスキーマがGoalに達したかを評価する関数
Fail():Active時にスキーマがfail状態かを判定する関数
SleepActions():Sleep前に実行されるステートマシン
SleepMonitor():Sleep時にResumeするための評価関数
ResumeActions():Resume前にResumeするためのステートマシン
DestroyMonitor():Sleep時にスキーマがfail状態か判定する評価関数
MakePronome():ツリー全体のターゲットを決定する関数
(5−3)状況依存行動階層の機能
状況依存行動階層(SBL)102は、短期記憶部92及び長期記憶部93の記憶内容や、内部状態管理部91によって管理される内部状態を基に、ロボット装置1が現在置かれている状況に即応した動作を制御する。
【0176】
前項で述べたように、本具体例における状況依存行動階層102は、スキーマのツリー構造(図22を参照のこと)で構成されている。各スキーマは、自分の子供と親の情報を知っている状態で独立性を保っている。このようなスキーマ構成により、状況依存行動階層102は、Concurrentな評価、Concurrentな実行、Preemption、Reentrantという主な特徴を持っている。以下、これらの特徴について詳解する。
【0177】
(5−3−1)Concurrentな評価:
行動記述モジュールとしてのスキーマは外部刺激や内部状態の変化に応じた状況判断を行なうMonitor機能を備えていることは既に述べた。Monitor機能は、スキーマがクラス・オブジェクトSchema BaseでMonitor関数を備えていることにより実装されている。Monitor関数とは、外部刺激と内部状態に応じて当該スキーマの行動価値ALを算出する関数である。
【0178】
図22に示すようなツリー構造を構成する場合、上位(親)のスキーマは外部刺激183と内部状態の変化184を引数として下位(子供)のスキーマのMonitor関数をコールすることができ、子供のスキーマは行動価値ALを返り値とする。また、スキーマは自分の行動価値ALを算出するために、更に子供のスキーマのMonitor関数をコールすることができる。そして、ルートのスキーマ201〜203には各サブツリーからの行動価値ALが返されるので、外部刺激183と内部状態の変化184に応じた最適なスキーマすなわち動作を統合的に判断することができる。
【0179】
このようにツリー構造になっていることから、外部刺激183と内部状態の変化184による各スキーマの評価は、まずツリー構造の下から上に向かってConcurrentに行なわれる。即ち、スキーマに子供スキーマがある場合には、選択した子供のMonitor関数をコールしてから、自身のMonitor関数を実行する。次いで、ツリー構造の上から下に向かって評価結果としての実行許可を渡していく。評価と実行は、その動作が用いるリソースの競合を解きながら行なわれる。
【0180】
本具体例における状況依存行動階層102は、スキーマのツリー構造を利用して、並列的に行動の評価を行なうことができるので、外部刺激183や内部状態の変化184等の状況に対しての適応性がある。また、評価時には、ツリー全体に関しての評価を行ない、このとき算出される行動価値ALによりツリーが変更されるので、スキーマすなわち実行する動作を動的にプライオリタイズすることができる。
【0181】
(5−3−2)Concurrentな実行:
ルートのスキーマには各サブツリーからの行動価値ALが返されるので、外部刺激183と内部状態の変化184に応じた最適なスキーマすなわち動作を統合的に判断することができる。例えば行動価値ALが最も高いスキーマを選択したり、行動価値ALが所定の閾値を越えた2以上のスキーマを選択して並列的に行動実行するようにしてもよい(但し、並列実行するときは各スキーマどうしでハードウェア・リソースの競合がないことを前提とする)。
【0182】
選択され、実行許可をもらったスキーマは実行される。すなわち、実際にそのスキーマは更に詳細の外部刺激183や内部状態の変化184を観測して、コマンドを実行する。実行に関しては、ツリー構造の上から下に向かって順次すなわちConcurrentに行なわれる。即ち、スキーマに子供スキーマがある場合には、子供のActions関数を実行する。
【0183】
Action関数は、スキーマ自身が持つ行動(動作)を記述したステートマシンを備えている。図22に示すようなツリー構造を構成する場合、親スキーマは、Action関数をコールして、子供スキーマの実行を開始したり中断させたりすることができる。
【0184】
本具体例における状況依存行動階層(SBL)102は、スキーマのツリー構造を利用して、リソースが競合しない場合には、余ったリソースを使う他のスキーマを同時に実行することができる。但し、Goalまでに使用するリソースに対して制限を加えないと、ちぐはぐな行動出現が起きる可能性がある。状況依存行動階層102において決定された状況依存行動は、リソース・マネージャにより反射行動部(ReflexiveSBL)103による反射的行動とのハードウェア・リソースの競合の調停を経て、機体動作(Motion Controller)に適用される。
【0185】
(5−3−3)Preemption:
1度実行に移されたスキーマであっても、それよりも重要な(優先度の高い)行動があれば、スキーマを中断してそちらに実行権を渡さなければならない。また、より重要な行動が終了(完結又は実行中止等)したら、元のスキーマを再開して実行を続けることも必要である。
【0186】
このような優先度に応じたタスクの実行は、コンピュータの世界におけるOS(オペレーティング・システム)のPreemptionと呼ばれる機能に類似している。OSでは、スケジュールを考慮するタイミングで優先度のより高いタスクを順に実行していくという方針である。
【0187】
これに対し、本具体例におけるロボット装置1の制御システム10は、複数のオブジェクトにまたがるため、オブジェクト間での調停が必要になる。例えば反射行動を制御するオブジェクトである反射行動部103は、上位の状況依存行動を制御するオブジェクトである状況依存行動階層102の行動評価を気にせずに物を避けたり、バランスをとったりする必要がある。これは、実際に実行権を奪い取り実行を行なう訳であるが、上位の行動記述モジュール(SBL)に、実行権利が奪い取られたことを通知して、上位はその処理を行なうことによってPreemptiveな能力を保持する。
【0188】
また、状況依存行動層102内において、外部刺激183と内部状態の変化184に基づく行動価値ALの評価の結果、あるスキーマに実行許可がなされたとする。更に、その後の外部刺激183と内部状態の変化184に基づく行動価値ALの評価により、別のスキーマの重要度の方がより高くなったとする。このような場合、実行中のスキーマのActions関数を利用してSleep状態にして中断することにより、Preemptiveな行動の切り替えを行なうことができる。
【0189】
実行中のスキーマのActions()の状態を保存して、異なるスキーマのActions()を実行する。また、異なるスキーマのActions()が終了した後、中断されたスキーマのActions()を再度実行することができる。
【0190】
また、実行中のスキーマのActions()を中断して、異なるスキーマに実行権が移動する前に、SleepActions()を実行する。例えば、ロボット装置1は、対話中にサッカーボールを見つけると、「ちょっと待ってね」と言って、サッカーすることができる。
【0191】
(5−3−4)Reentrant:
状況依存行動階層102を構成する各スキーマは、一種のサブルーチンである。スキーマは、複数の親からコールされた場合には、その内部状態を記憶するために、それぞれの親に対応した記憶空間を持つ必要がある。
【0192】
これは、コンピュータの世界では、OSが持つReentrant性に類似しており、本明細書ではスキーマのReentrant性と呼ぶ。図27に示したように、スキーマはクラス・オブジェクトで構成されており、クラス・オブジェクトのエンティティすなわちインスタンスをターゲット(Pronome)毎に生成することによりReentrant性が実現される。
【0193】
スキーマのReentrant性について、図28を参照しながらより具体的に説明する。Schema Handler212は、スキーマを管理するためのクラス・オブジェクトであり、SBL102を構成するスキーマのコンフィギュレーション情報をファイルとして保管している。システムの起動時に、Schema Handler212は、このコンフィギュレーション情報ファイルを読み込んで、SBL102内のスキーマ構成を構築する。図28に示す例では、Eat221やDialog222等の行動(動作)を規定するスキーマのエンティティがメモリ空間上にマッピングされているとする。
【0194】
ここで、外部刺激183と内部状態の変化184に基づく行動価値ALの評価により、スキーマDialog222に対してAというターゲット(Pronome)が設定されて、Dialog222が人物Aとの対話を実行するようになったとする。
【0195】
そこに、人物Bがロボット装置1と人物Aとの対話に割り込み、その後、外部刺激183と内部状態の変化184に基づく行動価値ALの評価を行なった結果、Bとの対話を行なうスキーマ223の方がより優先度が高くなったとする。
【0196】
このような場合、Schema Handler212は、Bとの対話を行なうためのクラス継承した別のDialogエンティティ(インスタンス)をメモリ空間上にマッピングする。別のDialogエンティティを使用して、先のDialogエンティティとは独立して、Bとの対話を行なうことから、Aとの対話内容は破壊されずに済む。従って、DialogAはデータの一貫性を保持することができ、Bとの対話が終了すると、Aとの対話を中断した時点から再開することができる。
【0197】
Readyリスト内のスキーマは、その対象物(外部刺激183)に応じて評価すなわち行動価値ALの計算が行なわれ、実行権が引き渡される。その後、Readyリスト内に移動したスキーマのインスタンスを生成して、これ以外の対象物に対して評価を行なう。これにより、同一のスキーマをactive又はsleep状態にすることができる。
【0198】
以上のような制御システムを実現する制御プログラムは、上述したように、予めフラッシュROM23に格納されており、ロボット装置1の電源投入初期時において読み出される。このようにしてこのロボット装置1においては、自己及び周囲の状況や、使用者からの指示及び働きかけに応じて自律的に行動し得るようになされている。
【0199】
【発明の効果】
以上詳細に説明したように、本発明に係るロボット装置は、内部状態及び外部刺激に基づき自律的に行動を選択し発現するロボット装置において、行動が記述された複数の行動記述モジュールと、上記内部状態及び外部刺激から上記複数の行動記述モジュールに記述された各行動の行動価値を算出する行動価値算出手段と、上記行動価値に基づき上記行動記述モジュールを選択し、当該行動記述モジュールに記述された行動を発現させる行動選択手段とを有し、各上記行動記述モジュールに記述された行動には所定の内部状態及び外部刺激が対応付けられ、上記行動価値算出手段は、内部状態に対応付けられた行動に対する欲求値及び内部状態に基づく満足度を求め、現在の内部状態から得られる欲求値と、上記現在の内部状態と入力された外部刺激に基づき変化すると予想される予想内部状態とから求まる予想満足度変化とに基づき、各行動に対する上記行動価値を算出するので、自身の内部状態から発現する行動の欲求度を求め、また、現在の内部状態に基づく満足度からの行動発現後に予想される変化量を予想満足度として求め、これらから行動価値を算出し、この行動価値に基づいて行動選択することにより、同じ外部刺激でも内部状態の値によって異なる行動が選択されるので、環境やユーザとのコミュニケーションに応じて変化する内部状態及び種々の外部刺激に対して一義的ではない様々なユーザを飽きさせない行動を発現させることができる。
【図面の簡単な説明】
【図1】本発明の実施の形態のロボット装置の外観を示す斜視図である。
【図2】本発明の実施の形態におけるロボット装置の機能構成を模式的に示すブロック図である。
【図3】本発明の実施の形態における制御ユニットの構成を更に詳細に示すブロック図である。
【図4】本発明の実施の形態におけるロボット装置の制御システムにおいて、各行動に対応する行動価値を算出してこれに基づき行動出力する処理を行う行動選択制御システム部分を示す模式図である。
【図5】上図の行動価値算出部が内部状態及び外部刺激から行動価値ALを算出する処理の流れを示す模式図である。
【図6】横軸に内部状態ベクトルIntVの各成分をとり、縦軸に欲求ベクトルInsVの各成分をとって、内部状態と欲求との関係を示すグラフ図である。
【図7】行動価値算出データベースにおける行動価値算出データを示す図である。
【図8】横軸にIntV_NOURISHMENT「栄養状態」、縦軸に内部状態「栄養状態」に対する満足度S_NOURISHMENTをとり、内部状態と満足度との関係を示すグラフ図である。
【図9】横軸にIntV_FATIGUE「疲れ」、縦軸に内部状態「疲れ」に対する満足度S_FATIGUEをとって、内部状態と満足度との関係を示すグラフ図である。
【図10】(a)及び(b)は夫々内部状態「栄養状態」(「NOURISHMENT」)及び「疲れ」(「FATIGUE」)の予想内部状態変化量を求める場合の行動価値算出データ構造の一例を示す図である。
【図11】1次元の外部刺激の線形補間方法を説明する図である。
【図12】2次元の外部刺激の線形補間方法を説明する図である。
【図13】行動価値算出部における行動価値算出方法を示すフローチャートである。
【図14】本発明の実施の形態におけるロボット装置の制御システムにおいて、外部刺激が入力されてから行動価値算出データベースの学習を行うまでの流れを示す模式図である。
【図15】1次元外部刺激の予想内部状態変化量の更新例を説明する図である。
【図16】2次元外部刺激の予想内部状態変化量の更新例を説明する図である。
【図17】学習により、発現された行動結果に応じて行動価値算出データベースを更新する方法を示すフローチャートである。
【図18】本発明の具体例におけるロボット装置の行動制御システムの機能構成を示す模式図である。
【図19】本発明の具体例における行動制御システムのオブジェクト構成を示す模式図である。
【図20】本発明の具体例における状況依存行動階層による状況依存行動制御の形態を示す模式図である。
【図21】状況依存行動階層が複数のスキーマによって構成されている様子を示す模式図である。
【図22】状況依存行動階層におけるスキーマのツリー構造を示す模式図である。
【図23】状況依存行動階層において通常の状況依存行動を制御するためのメカニズムを示す模式図である。
【図24】反射行動部におけるスキーマの構成を示す模式図である。
【図25】反射行動部により反射的行動を制御するためのメカニズムを示す模式図である。
【図26】状況依存行動階層において使用されるスキーマのクラス定義を示す模式図である。
【図27】状況依存行動階層内のクラスの機能的構成を示す模式図である。
【図28】スキーマのReentrant性を説明する図である。
【符号の説明】
1 ロボット装置、10 制御システム、15 CCDカメラ、16 マイクロフォン、17 スピーカ、18 タッチ・センサ、19 LEDインジケータ、20 制御部、21 CPU、22 RAM、23 ROM、24 不揮発メモリ、25 インターフェース、26 無線通信インターフェース、27 ネットワーク・インターフェース・カード、28 バス、29 キーボード、40 入出力部、50 駆動部、51 モータ、52 エンコーダ、53 ドライバ、81 視覚認識機能部、82 聴覚認識機能部、83 接触認識機能部、91 内部状態管理部、92 短期記憶部(STM)、93 長期記憶部(LTM)、100 行動選択制御システム、101 熟考行動階層、102 状況依存行動階層(SBL)、103 反射行動部、120 行動価値算出部、121 行動価値算出データベース、130 行動選択部、132 要素行動

Claims (11)

  1. 内部状態及び外部刺激に基づき自律的に行動を選択し発現するロボット装置において、
    行動が記述された複数の行動記述モジュールと、
    上記内部状態及び外部刺激から上記複数の行動記述モジュールに記述された各行動の行動価値を算出する行動価値算出手段と、
    上記行動価値に基づき上記行動記述モジュールを選択し、当該行動記述モジュールに記述された行動を発現させる行動選択手段とを有し、
    各上記行動記述モジュールに記述された行動には所定の内部状態及び外部刺激が対応付けられ、
    上記行動価値算出手段は、内部状態に対応付けられた行動に対する欲求値及び内部状態に基づく満足度を求め、現在の内部状態から求まる欲求値と、上記現在の内部状態及び入力された外部刺激に基づき変化すると予想される予想内部状態から求まる予想満足度変化とに基づき、各行動に対する上記行動価値を算出する
    ことを特徴とするロボット装置。
  2. 上記行動価値算出手段は、上記現在の内部状態から求まる上記欲求値と、該現在の内部状態から求まる上記満足度と、上記予想満足度変化とに基づき、各行動に対する上記行動価値を算出する
    ことを特徴とする請求項1記載のロボット装置。
  3. 上記行動価値算出手段は、入力される外部刺激と、上記予想内部状態変化とが対応付けられた行動価値算出データベースを有し、この行動価値算出データベースを参照して上記行動価値を算出することを特徴とする請求項1記載のロボット装置。
  4. 上記行動価値算出データベースは、上記外部刺激の値に対応付けられた上記予想内部状態変化を有する
    ことを特徴とする請求項3記載のロボット装置。
  5. 上記行動価値算出手段は、行動価値算出データベースにはない値が入力された場合は、線形モデルを使用し線形補間を行って予想内部状態変化を算出する
    ことを特徴とする請求項4記載のロボット装置。
  6. 内部状態及び外部刺激に基づき自律的に行動を選択して発現するような制御を行うロボット装置の行動制御方法において、
    上記内部状態及び外部刺激から複数の行動記述モジュールに記述された各行動の行動価値を算出する行動価値算出工程と、
    上記行動価値に基づき上記行動記述モジュールを選択し、当該行動記述モジュールに記述された行動を発現させる行動選択工程とを有し、
    各上記行動記述モジュールに記述された行動には所定の内部状態及び外部刺激が対応付けられ、
    上記行動価値算出工程では、内部状態に対応付けられた行動に対する欲求値及び内部状態に基づく満足度を求め、現在の内部状態から求まる欲求値と、上記現在の内部状態及び入力された外部刺激に基づき変化すると予想される予想内部状態から求まる予想満足度変化とに基づき、各行動に対する上記行動価値が算出される
    ことを特徴とするロボット装置の行動制御方法。
  7. 上記行動価値算出工程では、上記現在の内部状態から求まる上記欲求値と、該現在の内部状態から求まる上記満足度と、上記予想満足度変化とに基づき、各行動に対する上記行動価値が算出される
    ことを特徴とする請求項6記載のロボット装置の行動制御方法。
  8. 上記行動価値算出工程では、入力される外部刺激と、上記予想内部状態変化とが対応付けられた行動価値算出データベースを参照して上記行動価値が算出されることを特徴とする請求項6記載のロボット装置の行動制御方法。
  9. 上記行動価値算出データベースは、上記外部刺激の値に対応付けられた上記予想内部状態変化を有する
    ことを特徴とする請求項8記載のロボット装置の行動制御方法。
  10. 上記行動価値算出工程では、行動価値算出データベースにはない値が入力された場合は、線形モデルを使用し線形補間を行って予想内部状態変化が算出される
    ことを特徴とする請求項9記載のロボット装置の行動制御方法。
  11. ロボット装置の内部状態及び外部刺激に基づき自律的に行動を選択して発現するような制御を行う動作をコンピュータに実行させるためのプログラムにおいて、
    上記内部状態及び外部刺激から複数の行動記述モジュールに記述された各行動の行動価値を算出する行動価値算出工程と、
    上記行動価値に基づき上記行動記述モジュールを選択し、当該行動記述モジュールに記述された行動を発現させる行動選択工程とを有し、
    各上記行動記述モジュールに記述された行動には所定の内部状態及び外部刺激が対応付けられ、
    上記行動価値算出工程では、内部状態に対応付けられた行動に対する欲求値及び内部状態に基づく満足度を求め、現在の内部状態から求まる欲求値と、上記現在の内部状態及び入力された外部刺激に基づき変化すると予想される予想内部状態から求まる予想満足度変化とに基づき、各行動に対する上記行動価値が算出される
    ことを特徴とするロボット装置のプログラム。
JP2003065587A 2003-03-11 2003-03-11 ロボット装置、その行動制御方法及びプログラム Withdrawn JP2004268235A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2003065587A JP2004268235A (ja) 2003-03-11 2003-03-11 ロボット装置、その行動制御方法及びプログラム
PCT/JP2004/003030 WO2004080665A1 (ja) 2003-03-11 2004-03-09 ロボット装置、その行動制御方法及びプログラム
CNB2004800065833A CN100364731C (zh) 2003-03-11 2004-03-09 机器人装置、其行为控制方法及程序
EP04718724A EP1602457B1 (en) 2003-03-11 2004-03-09 Robot device, behavior control method thereof, and program
US10/547,922 US7853357B2 (en) 2003-03-11 2004-03-09 Robot behavior control based on current and predictive internal, external condition and states with levels of activations

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003065587A JP2004268235A (ja) 2003-03-11 2003-03-11 ロボット装置、その行動制御方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2004268235A true JP2004268235A (ja) 2004-09-30

Family

ID=32984500

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003065587A Withdrawn JP2004268235A (ja) 2003-03-11 2003-03-11 ロボット装置、その行動制御方法及びプログラム

Country Status (5)

Country Link
US (1) US7853357B2 (ja)
EP (1) EP1602457B1 (ja)
JP (1) JP2004268235A (ja)
CN (1) CN100364731C (ja)
WO (1) WO2004080665A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014504959A (ja) * 2011-01-26 2014-02-27 本田技研工業株式会社 人間型ロボットのジェスチャと音声の同期
WO2018139275A1 (ja) * 2017-01-30 2018-08-02 富士通株式会社 機器、出力装置、出力方法および出力プログラム

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3875659B2 (ja) * 2003-07-25 2007-01-31 株式会社東芝 カメラ装置及びロボット装置
US7383100B2 (en) * 2005-09-29 2008-06-03 Honda Motor Co., Ltd. Extensible task engine framework for humanoid robots
KR100825719B1 (ko) * 2005-12-09 2008-04-29 한국전자통신연구원 복수의 감정 생성 로봇 및 로봇에서 복수의 감정 생성 방법
US8648867B2 (en) 2006-09-25 2014-02-11 Neurala Llc Graphic processor based accelerator system and method
KR100883352B1 (ko) * 2006-11-21 2009-02-11 한국전자통신연구원 원격대화에서 감정 및 의사의 표현 방법과 이를 위한 리얼이모티콘 시스템
US20080119959A1 (en) * 2006-11-21 2008-05-22 Park Cheonshu Expression of emotions in robot
JP2008152362A (ja) * 2006-12-14 2008-07-03 Konami Digital Entertainment:Kk ゲームプログラム、ゲーム装置及びゲーム制御方法
US8909370B2 (en) * 2007-05-08 2014-12-09 Massachusetts Institute Of Technology Interactive systems employing robotic companions
US9079306B2 (en) * 2007-10-22 2015-07-14 Honda Motor Co., Ltd. Evaluation of communication middleware in a distributed humanoid robot architecture
US8265789B2 (en) * 2007-12-03 2012-09-11 Electronics And Telecommunications Research Institute Network-based robot system and method for action execution of robot
US20090319459A1 (en) * 2008-02-20 2009-12-24 Massachusetts Institute Of Technology Physically-animated Visual Display
WO2009158653A1 (en) * 2008-06-27 2009-12-30 Intuitive Automata, Inc. Apparatus and method for assisting in achieving desired behavior patterns
EP2216145B1 (en) * 2009-02-06 2011-06-08 Honda Research Institute Europe GmbH Learning and use of schemata in robotic devices
KR20110015765A (ko) * 2009-08-10 2011-02-17 삼성전자주식회사 로봇의 경로계획장치 및 그 방법
ES2358139B1 (es) * 2009-10-21 2012-02-09 Thecorpora, S.L. Robot social.
JP5270767B2 (ja) * 2009-11-06 2013-08-21 株式会社日立製作所 移動ロボットシステム
DE102009054230A1 (de) * 2009-11-23 2011-05-26 Kuka Roboter Gmbh Verfahren und Vorrichtung zum Steuern von Manipulatoren
FR2969026B1 (fr) * 2010-12-17 2013-02-01 Aldebaran Robotics Robot humanoide dote d'un gestionnaire de ses ressources physiques et virtuelles, procedes d'utilisation et de programmation
US9218316B2 (en) 2011-01-05 2015-12-22 Sphero, Inc. Remotely controlling a self-propelled device in a virtualized environment
US10281915B2 (en) 2011-01-05 2019-05-07 Sphero, Inc. Multi-purposed self-propelled device
US9429940B2 (en) * 2011-01-05 2016-08-30 Sphero, Inc. Self propelled device with magnetic coupling
US9090214B2 (en) 2011-01-05 2015-07-28 Orbotix, Inc. Magnetically coupled accessory for a self-propelled device
US20120173050A1 (en) 2011-01-05 2012-07-05 Bernstein Ian H System and method for controlling a self-propelled device in connection with a virtual environment
US20120244969A1 (en) 2011-03-25 2012-09-27 May Patents Ltd. System and Method for a Motion Sensing Device
US20130106894A1 (en) 2011-10-31 2013-05-02 Elwha LLC, a limited liability company of the State of Delaware Context-sensitive query enrichment
US20130106682A1 (en) * 2011-10-31 2013-05-02 Elwha LLC, a limited liability company of the State of Delaware Context-sensitive query enrichment
US9573276B2 (en) * 2012-02-15 2017-02-21 Kenneth Dean Stephens, Jr. Space exploration with human proxy robots
US9292758B2 (en) 2012-05-14 2016-03-22 Sphero, Inc. Augmentation of elements in data content
JP2015524951A (ja) 2012-05-14 2015-08-27 オルボティックス, インコーポレイテッドOrbotix, Inc. 画像内で丸い物体を検出することによるコンピューティングデバイスの操作
US9827487B2 (en) 2012-05-14 2017-11-28 Sphero, Inc. Interactive augmented reality using a self-propelled device
US10056791B2 (en) 2012-07-13 2018-08-21 Sphero, Inc. Self-optimizing power transfer
US20140288704A1 (en) * 2013-03-14 2014-09-25 Hanson Robokind And Intelligent Bots, Llc System and Method for Controlling Behavior of a Robotic Character
EP2999940A4 (en) 2013-05-22 2017-11-15 Neurala Inc. Methods and apparatus for early sensory integration and robust acquisition of real world knowledge
WO2014204615A2 (en) 2013-05-22 2014-12-24 Neurala, Inc. Methods and apparatus for iterative nonspecific distributed runtime architecture and its application to cloud intelligence
US9211644B1 (en) * 2013-10-25 2015-12-15 Vecna Technologies, Inc. System and method for instructing a device
US9829882B2 (en) 2013-12-20 2017-11-28 Sphero, Inc. Self-propelled device with center of mass drive system
KR20170036657A (ko) 2014-03-19 2017-04-03 뉴럴라 인코포레이티드 자율 로봇 제어를 위한 방법들 및 장치
US9626566B2 (en) 2014-03-19 2017-04-18 Neurala, Inc. Methods and apparatus for autonomous robotic control
WO2016014137A2 (en) * 2014-05-06 2016-01-28 Neurala, Inc. Apparatuses, methods, and systems for defining hardware-agnostic brains for autonomous robots
CN106293042B (zh) * 2015-06-26 2020-06-23 联想(北京)有限公司 一种信息处理方法及电子设备
WO2017177128A1 (en) * 2016-04-08 2017-10-12 The Trustees Of Columbia University In The City Of New York Systems and methods for deep reinforcement learning using a brain-artificial intelligence interface
EP3450118A4 (en) * 2016-04-28 2019-04-10 Fujitsu Limited ROBOT
CN106393141A (zh) * 2016-10-31 2017-02-15 江苏华航威泰机器人科技有限公司 一种机器人控制系统
CN106625665B (zh) * 2016-12-15 2019-03-12 北京卫星制造厂 一种可移动式自动寻址的钻铣机器人系统
DE112018006439T5 (de) * 2018-03-14 2020-09-03 Mitsubishi Electric Corporation Systemkonstruktionsunterstützungsvorrichtung, Systemkonstruktionsunterstützungsverfahren und Systemkonstruktionsunterstützungsprogramm
CN112136141A (zh) * 2018-03-23 2020-12-25 谷歌有限责任公司 基于自由形式自然语言输入控制机器人
US11816551B2 (en) 2018-11-05 2023-11-14 International Business Machines Corporation Outcome-based skill qualification in cognitive interfaces for text-based and media-based interaction
US11602854B2 (en) 2018-12-18 2023-03-14 Samsung Electronics Co., Ltd. Method and apparatus for controlling behavior of service robot

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6224988A (ja) * 1985-07-23 1987-02-02 志井田 孝 感情をもつロボツト
US6031549A (en) * 1995-07-19 2000-02-29 Extempo Systems, Inc. System and method for directed improvisation by computer controlled characters
JPH10289006A (ja) * 1997-04-11 1998-10-27 Yamaha Motor Co Ltd 疑似感情を用いた制御対象の制御方法
DE69739216D1 (de) * 1997-08-29 2009-03-05 Sony France Sa Der Entwicklung von konditionierten Reflexen angepasstes System
JP3086206B2 (ja) * 1998-07-17 2000-09-11 科学技術振興事業団 エージェント学習装置
US6941199B1 (en) * 1998-07-20 2005-09-06 The Procter & Gamble Company Robotic system
JP2000042959A (ja) 1998-07-28 2000-02-15 Denso Corp 移動ロボットシステムの充電制御装置
JP2000064933A (ja) * 1998-08-19 2000-03-03 Yamaha Motor Co Ltd 2サイクル筒内噴射エンジンの始動方法
US6295602B1 (en) * 1998-12-30 2001-09-25 Spyrus, Inc. Event-driven serialization of access to shared resources
US6347261B1 (en) * 1999-08-04 2002-02-12 Yamaha Hatsudoki Kabushiki Kaisha User-machine interface system for enhanced interaction
JP2001038658A (ja) * 1999-08-04 2001-02-13 Yamaha Motor Co Ltd ロボットにおける触覚表現システム
US6604091B2 (en) * 1999-09-10 2003-08-05 Yamaha Hatsudoki Kabushiki Kaisha Interactive artificial intelligence
US6446056B1 (en) * 1999-09-10 2002-09-03 Yamaha Hatsudoki Kabushiki Kaisha Interactive artificial intelligence
US6587846B1 (en) * 1999-10-01 2003-07-01 Lamuth John E. Inductive inference affective language analyzer simulating artificial intelligence
US6490501B1 (en) * 1999-10-06 2002-12-03 Bell Helicopter Textron Inc. Cure monitoring and control system
JP2001260063A (ja) * 2000-03-21 2001-09-25 Sony Corp 多関節型ロボット及びその動作制御方法
KR20020026165A (ko) * 2000-03-24 2002-04-06 이데이 노부유끼 로봇 장치의 행동 결정 방법 및 로봇 장치
JP2001334482A (ja) * 2000-03-24 2001-12-04 Sony Corp ロボット装置及びロボット装置の行動決定方法
JP2001277166A (ja) * 2000-03-31 2001-10-09 Sony Corp ロボット及びロボットの行動決定方法
US6845297B2 (en) * 2000-05-01 2005-01-18 Irobot Corporation Method and system for remote control of mobile robot
JP4491912B2 (ja) * 2000-05-22 2010-06-30 ソニー株式会社 バッテリ駆動の脚式移動ロボット及びその制御方法
JP2002018146A (ja) * 2000-07-04 2002-01-22 Tomy Co Ltd 対話型玩具、反応行動パターン生成装置および反応行動パターン生成方法
FR2811449B1 (fr) * 2000-07-05 2008-10-10 Mathematiques Appliquees S A Systeme automatique pour la prise de decision par un agent virtuel ou physique
JP2002036158A (ja) * 2000-07-27 2002-02-05 Yamaha Motor Co Ltd 自律機能を有する電子機器
JP4296736B2 (ja) 2000-10-13 2009-07-15 ソニー株式会社 ロボット装置
CN100423911C (zh) * 2000-10-13 2008-10-08 索尼公司 机器人装置及其行为控制方法
KR20020061961A (ko) * 2001-01-19 2002-07-25 사성동 지능형 애완로봇
US6690134B1 (en) * 2001-01-24 2004-02-10 Irobot Corporation Method and system for robot localization and confinement
US7328196B2 (en) * 2003-12-31 2008-02-05 Vanderbilt University Architecture for multiple interacting robot intelligences
US8396592B2 (en) * 2001-06-12 2013-03-12 Irobot Corporation Method and system for multi-mode coverage for an autonomous robot
KR100624403B1 (ko) * 2001-10-06 2006-09-15 삼성전자주식회사 인체의 신경계 기반 정서 합성 장치 및 방법
US20040002790A1 (en) * 2002-06-28 2004-01-01 Paul Senn Sensitive devices and sensitive applications
US7303010B2 (en) * 2002-10-11 2007-12-04 Intelligent Robotic Corporation Apparatus and method for an autonomous robotic system for performing activities in a well
US7899760B2 (en) * 2004-12-07 2011-03-01 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Systems, methods and apparatus for quiesence of autonomic systems with self action

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014504959A (ja) * 2011-01-26 2014-02-27 本田技研工業株式会社 人間型ロボットのジェスチャと音声の同期
US9431027B2 (en) 2011-01-26 2016-08-30 Honda Motor Co., Ltd. Synchronized gesture and speech production for humanoid robots using random numbers
WO2018139275A1 (ja) * 2017-01-30 2018-08-02 富士通株式会社 機器、出力装置、出力方法および出力プログラム
JP2018122366A (ja) * 2017-01-30 2018-08-09 富士通株式会社 機器、出力装置、出力方法および出力プログラム
US10916236B2 (en) 2017-01-30 2021-02-09 Fujitsu Limited Output device, output method, and electronic apparatus

Also Published As

Publication number Publication date
CN1758991A (zh) 2006-04-12
US20060184273A1 (en) 2006-08-17
US7853357B2 (en) 2010-12-14
EP1602457A4 (en) 2010-05-12
EP1602457A1 (en) 2005-12-07
WO2004080665A1 (ja) 2004-09-23
CN100364731C (zh) 2008-01-30
EP1602457B1 (en) 2011-08-24

Similar Documents

Publication Publication Date Title
JP2004268235A (ja) ロボット装置、その行動制御方法及びプログラム
JP4244812B2 (ja) 行動制御システム及びロボット装置の行動制御方法
US7363108B2 (en) Robot and control method for controlling robot expressions
JP2005193331A (ja) ロボット装置及びその情動表出方法
KR101137205B1 (ko) 로봇의 행동 제어 시스템 및 행동 제어 방법, 및 로봇 장치
US8145492B2 (en) Robot behavior control system and method, and robot apparatus
US20050043956A1 (en) Speech communiction system and method, and robot apparatus
JP2006110707A (ja) ロボット装置
JP2007125631A (ja) ロボット装置及びその行動制御方法
JP3558222B2 (ja) ロボットの行動制御システム及び行動制御方法、並びにロボット装置
JP2004283958A (ja) ロボット装置、その行動制御方法及びプログラム
JP4552465B2 (ja) 情報処理装置、ロボット装置の行動制御方法、ロボット装置及びコンピュータ・プログラム
JP2007125629A (ja) ロボット装置及びその行動制御方法
JP4147960B2 (ja) ロボット装置、及びロボット装置の動作制御方法
JP2004283957A (ja) ロボット装置、その制御方法、及びプログラム
JP2005059186A (ja) ロボット装置及びその制御方法
JP2004283960A (ja) ロボット装置、その行動制御方法、及びプログラム
JP2004114285A (ja) ロボット装置及びその行動制御方法
JP2005321954A (ja) ロボット装置、情報処理システム及び情報処理方法、並びにコンピュータ・プログラム
JP2005193330A (ja) ロボット装置及びその情動表出方法
JP2001157980A (ja) ロボット装置及びその制御方法
JP2004209599A (ja) ロボット装置、ロボット装置の行動学習方法、ロボット装置の行動生成方法
JP2007125630A (ja) ロボット装置及びその行動制御方法
JP2004291147A (ja) ロボットの行動制御システム
Wei et al. Autonomous and Rational Bevavior of Sony AIBO Robot

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060606