JP3854061B2 - Pseudo-biological device, pseudo-biological behavior formation method in pseudo-biological device, and computer-readable storage medium describing program for causing pseudo-biological device to perform behavior formation - Google Patents

Pseudo-biological device, pseudo-biological behavior formation method in pseudo-biological device, and computer-readable storage medium describing program for causing pseudo-biological device to perform behavior formation Download PDF

Info

Publication number
JP3854061B2
JP3854061B2 JP2000363303A JP2000363303A JP3854061B2 JP 3854061 B2 JP3854061 B2 JP 3854061B2 JP 2000363303 A JP2000363303 A JP 2000363303A JP 2000363303 A JP2000363303 A JP 2000363303A JP 3854061 B2 JP3854061 B2 JP 3854061B2
Authority
JP
Japan
Prior art keywords
parameter value
simulated
action
association information
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000363303A
Other languages
Japanese (ja)
Other versions
JP2002163631A (en
Inventor
薫 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2000363303A priority Critical patent/JP3854061B2/en
Publication of JP2002163631A publication Critical patent/JP2002163631A/en
Application granted granted Critical
Publication of JP3854061B2 publication Critical patent/JP3854061B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Toys (AREA)
  • Manipulator (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、擬似生物装置及び擬似生物装置における擬似生物の行動形成方法及び擬似生物の行動形成を行うプログラムを記載したコンピュータ読み取り可能な記憶媒体に関する。
【0002】
【従来の技術】
近年、コンピュータのディスプレイ画面上にキャラクタの登場するソフトウェアアプリケーションや、実体として存在するキャラクタ性のあるロボットが種々発売されている。
【0003】
パソコン用のソフトウェアアプリケーションとして実施された例としては、イルカのようなトリのようなキャラクタの登場する「TEO(呼称は「テオ」:登録商標:富士通)」などが有名であり、また、自立したロボットとして実施された例としてはメタリックなデザインのイヌ型ロボット「AIBO(登録商標:ソニー)」などが有名である。また、外部のコンピュータから遠隔で制御される半自立型のロボットとして実施された例としてはフクロウのような顔を持つ車輪走行ロボット「R100(日本電気)」などが有名である。
【0004】
これらのソフトウェアアプリケーションやロボットは、己が造形として与えられたキャラクタをあたかも生きているかのように行動させることを目指したシステムである。そのためシステムは、使用者からの入力情報に応じてキャラクタの感情表現や行動などの応答を出力するように作られている。
【0005】
また、近頃では、それらソフトウェアアプリケーションやロボットの幾つかは、使用者の顔画像や音声波形などのパタン情報を認識する能力を有し、そのようなパタン認識結果を入力情報として応答できるように高度化されつつある。このようなシステムは、その演出しようとしているキャラクタ(必ずしも実在する生物ではない)に擬似的な生命を与えようとしている、いわゆる疑似生物システム(あるいは仮想生物システム)である。
【0006】
疑似生物システムは、システムの実体たるコンピュータやロボットの周囲環境を、システムの使用者が行う行動も含めて認識し、そのような周囲環境の認識結果に応じて変化する疑似生物内部の状態に応じて、所定の応答を返すような設計がなされている。例えば、使用者がかまってやると疑似生物は喜びを表現し、いじわるをすれば拗ねたり怒ったりする。このように感情や欲求のレベルでの対話性を備えた疑似生物は、実用的なタスクを実行させるための無味乾燥な対話性のみを有する、例えばワープロソフトや産業用ロボットと異なり、使用者に癒し効果をもたらし、生き物めいたところが使用者の興味や関心をかい、あるいはそのようなキャラクタ性のある精巧なロボットを使用者が個人で所有できることが嬉しいという理由から、老若男女を問わず広く受入れられつつある。
【0007】
ところで、このような疑似生物の行動を決定する方式には、これまで従来以下に示すような3通りの方式が実施されており、従来の疑似生物システムはこれらのいずれかによって動作を行っていた。
I、選択実行方式
II、小出し方式
III、強化学習方式
まず、Iは玩具として販売されている最も多くの疑似生物システムが採用している方式であり、システムに内蔵される記憶部に予め記憶されている複数の行動パタンの中から、システムに入力された信号に対応する行動を一つ選択して実行するという行動発現方式である。どのような信号が入力されたら、どのような行動をするべきかは、予めシステムに組み込まれており、その入力(状況)と行動の対応関係(行動パタン)が生き物のような応答性をもたらすように作り込まれているというものである。
【0008】
システムに入力された信号とは、システムの実体たるコンピュータやロボットに設けられた光センサや感圧センサからの信号であり、システムが備える光センサの前方を使用者が通過したり、システムが備える感圧センサを使用者が撫でたりした場合などに、所定の信号が入力されるようになっている。また、行動パタンとは、例えば使用者が光センサの前を通過した場合に、ソフトウェアアプリケーションであれば疑似生物が使用者に呼びかけたり、ロボットであればこのロボットが使用者に向かって歩き始めたり、使用者が感圧センサを撫でた場合に、疑似生物が音を発して吠えたりするといったことであり、行動のきっかけになる入力とそれに対して行われる疑似生物の行動を組にしたものである。
【0009】
しかしながら、このようなIでは、ある入力された信号に対する特定の行動パタンを選択し、この選択された行動パタンを疑似生物に実行させるため、状況が同じなら毎回同じ行動を繰り返すことになってしまう。そのため、使うほどに使用者が疑似生物の行動パタンを覚え、時として次に行う行動を予測できたり、疑似生物に対して興味が薄れ飽きてしまったり、生物らしく感じられず不愉快になったりする等の問題があった。さらに、疑似生物はある状況に対して決まった行動を起こすようにしかプログラムされておらず、その行動の結果どのような状況に至るのかということには全く感知せず、極めて刹那的に反応することしかできないという問題点もあった。
【0010】
なお、Iの発展型として、ある入力信号に対する特定の行動パタンを一つに限定せず複数用意しておき、乱数によりその場で一つに決定するという方式もあるが、予め用意されている、限られた選択肢の中で、その結果を考慮することなく行動することに変わりはないため、上記の問題が発生することに変わりはなかった。
【0011】
次に、IIは言葉を発する擬似生物「ファービー(登録商標:タイガーエレクトロニクスリミテッド)」などの言葉を発する疑似生物システムが採用している方式であり、システムに内蔵される記憶部に予め記憶されている複数の行動パタンの中から、システムに入力された信号に対応する行動パタンを選択して実行する点はIと同様である。
【0012】
しかしながら、ここで記憶されている行動パタンには、その発現時期を示す時間的な情報や入力量の情報が付加されており、システムが初めて起動されてからの経過時間や与えられた入力の量と共に選択される行動パタンが随時変化するという行動発現方式である。例えば起動から100時間までは、システムに入力される信号に対して発現可能な行動パタンはA、B、Cの3種類であり、このうちのいずれかが入力信号に応じて実行され、また100〜1000時間までの行動パタンはC〜Jの8種類があり、このうちのいずれかが実行され、また1000時間以上では行動パタンC、F、G、J〜Zがあり、このうちのいずれかが実行されるというものである。こうすることにより、疑似生物は時間の経過やかまってもらった量に応じて行動パタンを変える、すなわち使用者からは成長するように見えるのである。
【0013】
しかしながら、IIは経過時間や入力量に応じて選択可能な行動パタンが変化する点はIと相違するが、予め用意されている、限られた選択肢の中で、その結果を考慮することなく行動する点はIと全く同一である。そのため、IIにもIと同一の問題があった。
【0014】
次に、IIIは疑似生物に個性を持たせたり、行動をより洗練させたりするために採用している学習性を備えた方式であり、システムに内蔵される記憶部に予め記憶されている複数の行動パタンのそれぞれに発現頻度のパラメータが付加されており、この発現頻度の大きい行動パタンほど、それが対応している状況においてよく選択されるという行動発現方式である。
【0015】
このとき、一つの入力された信号に対して選択可能な複数の行動パタンがあり、この複数の行動パタンの中から選択された行動を行った時、使用者がどのような反応をするかによってその行動の発現頻度が変化する。
【0016】
例えば、行動後に使用者が疑似生物を叩くという反応(感圧センサへの入力が短時間で大きかった場合)をした場合には、今行った行動に対して疑似生物は「叱られた」と判断し、この行動の発現頻度を低下させる。一方、使用者が疑似生物を撫でるという反応(感圧センサへの入力が長時間で小さかった場合)をした場合には、今行った行動に対して疑似生物は「誉められた」と判断し、この行動の発現頻度を上昇させる。
【0017】
このように、疑似生物がとった行動に対して、使用者が誉めたり叱ったりすることで、使用者はイヌやネコと付き合う場合と同様の自然な方法で人工の生命たる疑似生物に良い行動と悪い行動を教えることができる。このように、結果に対して良いか悪いかという評価だけを与えて行う学習を強化学習という。行動の発現頻度を増減させる強化学習により、初めのうちは誉められる行動も叱られる行動も関係なく実行していた疑似生物が、学習が進むにつれて誉められる行動のみを行い、叱られる行動をしなくなっていく。そして、このような行動パタンの選択性は、使用者がどのように躾たかによって疑似生物毎に異なるので、疑似生物の個性を作り出すことができるのである。
【0018】
しかしながら、強化学習により疑似生物の個性は形成されるものの、やはり予め用意された、限られた選択肢の中からしか行動を選べないことに変わりはなく、その制約のもとで学習が頂点に達した暁には、発現頻度の高いお馴染みの行動しか現れなくなるため、使用者に飽きられてしまうという問題が発生する点はI、IIと同一である。
【0019】
以上述べた様なI〜IIIは、疑似生物が行動するときに、その状況に適したものとして予め設定(記憶)された限られた行動パタンから一つが選択されるのであり、時間の経過と共に使用者は疑似生物の行動パタンを予測できるようになって疑似生物への興味を失ったり、また疑似生物の反応が単一となっていくことから所詮玩具の範疇であると考えて使用しなくなったりする等の問題があった。
【0020】
また、個性付けができるといっても、選択された動作は記憶された行動パタンのうちのいずれか一つであることを考えれば、選択範囲が大きいか小さいかだけで決められる個性付けということであって、予め設定されている範疇を超えて疑似生物が行動パタンを増やしたり、予め設定されている範疇を超えた状況で行動したりということがなく、その個性付けや成長の様は使用者にとっては満足がいかない場合もあった。
【0021】
【発明が解決しようとする課題】
上述したように従来の疑似生物は、実行される行動パタンが予め記憶された中から選択されるため、使用者が疑似生物を使用するにつれ疑似生物の行動が予測可能になり、興味が薄れるといった問題があった。
【0022】
そこで本発明は上記従来の問題点に鑑みてなされたもので、行動パタンを時間の経過と共に自律的に増加させて、使用者が継続して疑似生物を使用し得る疑似生物システム及び擬似生物装置における疑似生物の行動形成方法及び疑似生物の行動形成を行うプログラムを記載したコンピュータ読み取り可能な記憶媒体の提供を目的とする。
【0023】
【課題を解決するための手段】
上記目的を達成するために本発明の擬似生物装置は、所望の動作パタンによって運動する擬似生物を実現する擬似生物装置であって、この擬似生物装置の内部に、前記擬似生物周囲の状況を外部パラメータ値として検知する外部状況入力手段と、前記擬似生物の擬似的感情を内部パラメータ値として保持する内部状況保持手段と、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段と、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索手段と、前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力手段と、を有する擬似生物装置において、前記擬似生物装置の内部に設けられ、前記選択された連関情報に基づいて行動した後に検知された前記外部パラメータ値及び保持された前記内部パラメータ値と、前記選択された連関情報の前記行動後の外部パラメータ値及び内部パラメータ値との類似度を計算し、前記類似度が所定値以上である場合は、前記選択された連関情報の前記遷移確率を増加させて、前記類似度が所定値未満である場合は、前記選択された連関情報の前記遷移確率を減少させる信頼性学習手段を具備したことを特徴とする。
また、本発明の擬似生物装置は、所望の動作パタンによって運動する擬似生物を実現する擬似生物装置であって、この擬似生物装置の内部に、前記擬似生物周囲の状況を外部パラメータ値として検知する外部状況入力手段と、前記擬似生物の擬似的感情を内部パラメータ値として保持する内部状況保持手段と、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段と、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索手段と、前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力手段と、を有する擬似生物装置において、前記擬似生物装置の内部に設けられ、前記選択された連関情報に基づいて行動した後に検知された前記外部パラメータ値及び保持された前記内部パラメータ値と、前記選択された連関情報の前記行動後の外部パラメータ値及び内部パラメータ値との類似度を計算し、前記類似度が所定値未満である場合は、前記選択された連関情報に基づいて行動する前の前記外部パラメータ値及び内部パラメータ値、前記選択された連関情報の行動、この擬似生物の行動後の前記外部パラメータ値及び前記内部パラメータ値と、1回の試行で1回成功していることを表す遷移確率と、を一組とする連関情報を生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶する目標外行動学習手段を具備したことを特徴とする。
また、本発明の擬似生物装置は、所望の動作パタンによって運動する擬似生物を実現する擬似生物装置であって、この擬似生物装置の内部に、前記擬似生物周囲の状況を外部パラメータ値として検知する外部状況入力手段と、前記擬似生物の擬似的感情を内部パラメータ値として保持する内部状況保持手段と、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生 物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段と、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索手段と、前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力手段と、を有する擬似生物装置において、前記外部状況入力手段により検知される外部パラメータ値から被検出体の行動を認識し、前記検知される外部パラメータ値を、被検出体に関する部分と、当該被検出体を除く環境部分に分解し、当該環境部分を当該被検出体の外部パラメータ値とし、前記検知される外部パラメータ値に基づいて被検出体の内部パラメータ値を特定するための情報を記憶した辞書情報を用いて、前記認識された行動の前後に検知された外部パラメータ値から前記被検出体の内部パラメータ値を推定し、前記認識された行動と、当該行動の前後に検知された前記被検出体の外部パラメータ値と、当該行動の前後に検知された外部パラメータ値から前記辞書情報を用いて推定された前記被検出体の内部パラメータ値と、を一組の連関情報として生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ記憶する他者行動学習手段とを具備したことを特徴とする。
また、本発明の擬似生物装置は、所望の動作パタンによって運動する擬似生物を実現する擬似生物装置であって、この擬似生物装置の内部に、前記擬似生物周囲の状況を外部パラメータ値として検知する外部状況入力手段と、前記擬似生物の擬似的感情を内部パラメータ値として保持する内部状況保持手段と、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段と、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索手段と、前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力手段と、を有する擬似生物装置において、前記連関データベース手段に記憶された前記連関情報から、行動後の外部パラメータ値及び内部パラメータ値が略同一のパラメータ値を有する複数の前記連関情報を抽出し、前記抽出された前記連関情報のうち、遷移確率が抽出された他の前記連関情報よりも下回る前記連関情報の前記行動前の前記外部パラメータ値及び内部パラメータ値を第1のパラメータ値とし、この他の前記連関情報の前記行動前の前記外部パラメータ値及び内部パラメータ値を第2のパラメータ値とし、前記第1のパラメータ値と、前記第1のパラメータ値を前記第2のパラメータ値へと変化させる行動と、第2のパラメータ値と、所定の初期値に設定された遷移確率と、を一組の連関情報として生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ記憶する状況調整行動学習手段を具備したことを特徴とする。
また、本発明の擬似生物装置は、所望の動作パタンによって運動する擬似生物を実現する擬似生物装置であって、この擬似生物装置の内部に、前記擬似生物周囲の状況を外部パラメータ値として検知する外部状況入力手段と、前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持する内部状況保持手段と、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段と、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動 検索手段と、前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力手段と、を有する擬似生物装置において、前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報と、を抽出し、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情が、前記第2の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記第2の連関情報までの行動と、前記第2の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶する連鎖行動学習手段を具備したことを特徴とする。
また、本発明の擬似生物装置は、所望の動作パタンによって運動する擬似生物を実現する擬似生物装置であって、この擬似生物装置の内部に、前記擬似生物周囲の状況を外部パラメータ値として検知する外部状況入力手段と、前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持する内部状況保持手段と、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段と、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索手段と、前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力手段と、を有する擬似生物装置において、前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報と、この第2の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第3の連関情報とを抽出し、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情が、前記第3の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記第2の連関情報の行動及び前記第2の連関情報から前記第3の連関情報までの行動と、前記第3の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶する連鎖行動学習手段を具備したことを特徴とする。
また、本発明の擬似生物装置は、所望の動作パタンによって運動する擬似生物を実現する擬似生物装置であって、この擬似生物装置の内部に、前記擬似生物周囲の状況を外部パラメータ値として検知する外部状況入力手段と、前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持する内部状況保持手段と、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段と、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動 検索手段と、前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力手段と、を有する擬似生物装置において、前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報とを1連鎖とするn(ただしnは2以上の自然数)連鎖なる(n+1)個の前記連関情報を抽出し、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情が、前記n連鎖目の第(n+1)の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記第(n+1)の連関情報までの(n+1)個の前記行動を、(n+1)個の前記連関情報が並べられた順序で行う行動と、前記第(n+1)の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶する連鎖行動学習手段を具備したことを特徴とする。
【0024】
また、本発明の行動生成方法は、所望の動作パタンによって運動する擬似生物を実現し、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置における擬似生物の行動形成方法であって、前記擬似生物周囲の状況を外部パラメータ値として検知する工程と、前記擬似生物の擬似的感情を内部パラメータ値として保持する工程と、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索工程と、前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力工程と、前記選択された連関情報に基づいて行動した後に検知された前記外部パラメータ値及び保持された前記内部パラメータ値と、前記選択された連関情報の前記行動後の外部パラメータ値及び内部パラメータ値との類似度を計算し、前記類似度が所定値以上である場合は、前記選択された連関情報の前記遷移確率を増加させて、前記類似度が所定値未満である場合は、前記選択された連関情報の前記遷移確率を減少させる信頼性学習工程と、を有することを特徴とする。
また、本発明の行動生成方法は、所望の動作パタンによって運動する擬似生物を実現し、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置における擬似生物の行動形成方法であって、前記擬似生物周囲の状況を外部パラメータ値として検知する工程と、前記擬似生物の擬似的感情を内部パラメータ値として保持する工程と、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索工程と、前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力工程と、前記選択された連関情報に基づいて行動した後に検知された前記外部パラメータ値及び保持された前記内部パラメータ値と、前記選択された連関情報の前記行動後の外部パラメータ値及び内部パラメータ値との類似度を計算し、前記類似度が所定値未満である場合は、前記選択された連関情報に基づいて行動する前の前記外部パラメータ値及び内部パラメータ値、前記選択された連関情報の行動、この擬似生物の行動後の前記外部パラメータ値及び前記内部パラメータ値と、1回の試行で1回成功していることを表す遷移確率と、を一組とする連関情報を生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶する目標外行動学習工程と、を有することを特徴とする。
また、本発明の行動生成方法は、所望の動作パタンによって運動する擬似生物を実現し、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置における擬似生物の行動形成方法であって、前記擬似生物周囲の状況を外部パラメータ値として検知する工程と、前記擬似生物の擬似的感情を内部パラメータ値として保持する工程と、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を 前記連関データベース手段から選択する行動検索工程と、前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力工程と、前記検知される外部パラメータ値から被検出体の行動を認識し、前記検知される外部パラメータ値を、被検出体に関する部分と、当該被検出体を除く環境部分に分解し、当該環境部分を当該被検出体の外部パラメータ値とし、前記検知される外部パラメータ値に基づいて被検出体の内部パラメータ値を特定するための情報を記憶した辞書情報を用いて、前記認識された行動の前後に検知された外部パラメータ値から前記被検出体の内部パラメータ値を推定し、前記認識された行動と、当該行動の前後に検知された前記被検出体の外部パラメータ値と、当該行動の前後に検知された外部パラメータ値から前記辞書情報を用いて推定された前記被検出体の内部パラメータ値と、を一組の連関情報として生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ記憶する他者行動学習工程と、を有することを特徴とする。
また、本発明の行動生成方法は、所望の動作パタンによって運動する擬似生物を実現し、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置における擬似生物の行動形成方法であって、前記擬似生物周囲の状況を外部パラメータ値として検知する工程と、前記擬似生物の擬似的感情を内部パラメータ値として保持する工程と、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索工程と、前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力工程と、前記連関データベース手段に記憶された前記連関情報から、行動後の外部パラメータ値及び内部パラメータ値が略同一のパラメータ値を有する複数の前記連関情報を抽出し、前記抽出された前記連関情報のうち、遷移確率が抽出された他の前記連関情報よりも下回る前記連関情報の前記行動前の前記外部パラメータ値及び内部パラメータ値を第1のパラメータ値とし、この他の前記連関情報の前記行動前の前記外部パラメータ値及び内部パラメータ値を第2のパラメータ値とし、前記第1のパラメータ値と、前記第1のパラメータ値を前記第2のパラメータ値へと変化させる行動と、第2のパラメータ値と、所定の初期値に設定された遷移確率と、を一組の連関情報として生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ記憶する状況調整行動学習工程と、を有することを特徴とする。
また、本発明の行動生成方法は、所望の動作パタンによって運動する擬似生物を実現し、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置における擬似生物の行動形成方法であって、前記擬似生物周囲の状況を外部パラメータ値として検知する工程と、前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持する工程と、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索工程と、前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力工程と、前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報と、を抽出し、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメ ータ値における前記快感情が、前記第2の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記第2の連関情報までの行動と、前記第2の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶する連鎖行動学習工程と、を有することを特徴とする。
また、本発明の行動生成方法は、所望の動作パタンによって運動する擬似生物を実現し、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置における擬似生物の行動形成方法であって、前記擬似生物周囲の状況を外部パラメータ値として検知する工程と、前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持する工程と、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索工程と、前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力工程と、前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報と、この第2の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第3の連関情報とを抽出し、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情が、前記第3の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記第2の連関情報の行動及び前記第2の連関情報から前記第3の連関情報までの行動と、前記第3の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶する連鎖行動学習工程と、を有することを特徴とする。
また、本発明の行動生成方法は、所望の動作パタンによって運動する擬似生物を実現し、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置における擬似生物の行動形成方法であって、前記擬似生物周囲の状況を外部パラメータ値として検知する工程と、前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持する工程と、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索工程と、前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力工程と、前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報とを1連鎖とするn(ただしnは2以上の自然数)連鎖なる(n+1)個の前記連関情報を抽出し、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ 値における前記快感情が、前記n連鎖目の第(n+1)の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記第(n+1)の連関情報までの(n+1)個の前記行動を、(n+1)個の前記連関情報が並べられた順序で行う行動と、前記第(n+1)の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶する連鎖行動学習工程と、を有することを特徴とする。
【0025】
また、本発明の記憶媒体は、所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるプログラムをコンピュータ読み取り可能なように記憶させた記憶媒体であって、
前記擬似生物周囲の状況を外部パラメータ値として検知させ、前記擬似生物の擬似的感情を内部パラメータ値として保持させ、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させ、前記選択された連関情報に基づいて前記擬似生物に行動させ前記選択された連関情報に基づいて行動させた後で検知された前記外部パラメータ値及び保持された前記内部パラメータ値と、前記選択された連関情報の前記行動後の外部パラメータ値及び内部パラメータ値との類似度を計算させ、前記類似度が所定値以上である場合は、前記選択された連関情報の前記遷移確率を増加させて、前記類似度が所定値未満である場合は、前記選択された連関情報の前記遷移確率を減少させることを特徴とする。
また、本発明の記憶媒体は、所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるプログラムをコンピュータ読み取り可能なように記憶させた記憶媒体であって、前記擬似生物周囲の状況を外部パラメータ値として検知させ、前記擬似生物の擬似的感情を内部パラメータ値として保持させ、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させ、前記選択された連関情報に基づいて前記擬似生物に行動させ、前記選択された連関情報に基づいて行動させた後で検知された前記外部パラメータ値及び保持された前記内部パラメータ値と、前記選択された連関情報の前記行動後の外部パラメータ値及び内部パラメータ値との類似度を計算させ、前記類似度が所定値未満である場合は、前記選択された連関情報に基づいて行動させる前の前記外部パラメータ値及び内部パラメータ値、前記選択された連関情報の行動、この擬似生物の行動後の前記外部パラメータ値及び前記内部パラメータ値と、1回の試行で1回成功していることを表す遷移確率と、を一組とする連関情報を生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶させることを特徴とする。
また、本発明の記憶媒体は、所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるプログラムをコンピュータ読み取り可能なように記憶させた記憶媒体であって、前記擬似生物周囲の状況を外部パラメータ値として検知させ、前記擬似生物の擬似的感情を内部パラメータ値として保持させ、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行 わせる行動を指示する連関情報を前記連関データベース手段から選択させ、前記選択された連関情報に基づいて前記擬似生物に行動させ、前記検知される外部パラメータ値から被検出体の行動を認識させ、前記検知される外部パラメータ値を、被検出体に関する部分と、当該被検出体を除く環境部分に分解し、当該環境部分を当該被検出体の外部パラメータ値とし、前記検知される外部パラメータ値に基づいて被検出体の内部パラメータ値を特定するための情報を記憶した辞書情報を用いて、前記認識された行動の前後に検知された外部パラメータ値から前記被検出体の内部パラメータ値を推定させ、前記認識された行動と、当該行動の前後に検知された前記被検出体の外部パラメータ値と、当該行動の前後に検知された外部パラメータ値から前記辞書情報を用いて推定された前記被検出体の内部パラメータ値と、を一組の連関情報として生成させ、この生成された連関情報が前記連関データベース手段に記憶されていなければ記憶させることを特徴とする。
また、本発明の記憶媒体は、所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるプログラムをコンピュータ読み取り可能なように記憶させた記憶媒体であって、
前記擬似生物周囲の状況を外部パラメータ値として検知させ、前記擬似生物の擬似的感情を内部パラメータ値として保持させ、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させ、前記選択された連関情報に基づいて前記擬似生物に行動させ、前記連関データベース手段に記憶された前記連関情報から、行動後の外部パラメータ値及び内部パラメータ値が略同一のパラメータ値を有する複数の前記連関情報を抽出させ、前記抽出された前記連関情報のうち、遷移確率が抽出された他の前記連関情報よりも下回る前記連関情報の前記行動前の前記外部パラメータ値及び内部パラメータ値を第1のパラメータ値とし、この他の前記連関情報の前記行動前の前記外部パラメータ値及び内部パラメータ値を第2のパラメータ値とし、前記第1のパラメータ値と、前記第1のパラメータ値を前記第2のパラメータ値へと変化させる行動と、第2のパラメータ値と、所定の初期値に設定された遷移確率と、を一組の連関情報として生成させ、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶させることを特徴とする。
また、本発明の記憶媒体は、所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるプログラムをコンピュータ読み取り可能なように記憶させた記憶媒体であって、前記擬似生物周囲の状況を外部パラメータ値として検知させ、前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持させ、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させ、前記選択された連関情報に基づいて前記擬似生物に行動させ、前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報と、を抽出させ、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情が、前記第2の連関情報の行動後の前記擬似生物の外部パラ メータ値及び内部パラメータ値における前記快感情よりも低いとき、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記第2の連関情報までの行動と、前記第2の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成させ、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶させることを特徴とする。
また、本発明の記憶媒体は、所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるプログラムをコンピュータ読み取り可能なように記憶させた記憶媒体であって、前記擬似生物周囲の状況を外部パラメータ値として検知させ、前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持させ、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させ、前記選択された連関情報に基づいて前記擬似生物に行動させ、前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報と、この第2の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第3の連関情報とを抽出させ、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情が、前記第3の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記第2の連関情報の行動及び前記第2の連関情報から前記第3の連関情報までの行動と、前記第3の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成させ、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶させることを特徴とする。
また、本発明の記憶媒体は、所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるプログラムをコンピュータ読み取り可能なように記憶させた記憶媒体であって、前記擬似生物周囲の状況を外部パラメータ値として検知させ、前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持させ、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させ、前記選択された連関情報に基づいて前記擬似生物に行動させ、前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報とを1連鎖とするn(ただしnは2以上の自然数)連鎖なる(n+1)個の前記連関情報を抽出させ、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情が、前記n連鎖目の第(n+1)の連関情報の行動後の前記擬似 生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記第(n+1)の連関情報までの(n+1)個の前記行動を、(n+1)個の前記連関情報が並べられた順序で行う行動と、前記第(n+1)の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成させ、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶させることを特徴とする。
【0026】
また、本発明のコンピュータプログラムは、所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるコンピュータプログラムであって、前記擬似生物周囲の状況を外部パラメータ値として検知させる機能と、前記擬似生物の擬似的感情を内部パラメータ値として保持させる機能と、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させる機能と、前記選択された連関情報に基づいて前記擬似生物に行動させる機能と、前記選択された連関情報に基づいて行動させた後で検知された前記外部パラメータ値及び保持された前記内部パラメータ値と、前記選択された連関情報の前記行動後の外部パラメータ値及び内部パラメータ値との類似度を計算させる機能と、前記類似度が所定値以上である場合は、前記選択された連関情報の前記遷移確率を増加させて、前記類似度が所定値未満である場合は、前記選択された連関情報の前記遷移確率を減少させる機能と、を有する。
また、本発明のコンピュータプログラムは、所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるコンピュータプログラムであって、前記擬似生物周囲の状況を外部パラメータ値として検知させる機能と、前記擬似生物の擬似的感情を内部パラメータ値として保持させる機能と、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させる機能と、前記選択された連関情報に基づいて前記擬似生物に行動させる機能と、前記選択された連関情報に基づいて行動させた後で検知された前記外部パラメータ値及び保持された前記内部パラメータ値と、前記選択された連関情報の前記行動後の外部パラメータ値及び内部パラメータ値との類似度を計算させる機能と、前記類似度が所定値未満である場合は、前記選択された連関情報に基づいて行動させる前の前記外部パラメータ値及び内部パラメータ値、前記選択された連関情報の行動、この擬似生物の行動後の前記外部パラメータ値及び前記内部パラメータ値と、1回の試行で1回成功していることを表す遷移確率と、を一組とする連関情報を生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶させる機能と、を有する。
また、本発明のコンピュータプログラムは、所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるコンピュータプログラムであって、前記擬似生物周囲の状況を外部パラメータ値として検知させる機能と、前記擬似生物の擬似的感情を内部パラメータ値として保持させる機能と、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動 を指示する連関情報を前記連関データベース手段から選択させる機能と、前記選択された連関情報に基づいて前記擬似生物に行動させる機能と、前記検知される外部パラメータ値から被検出体の行動を認識させ、前記検知される外部パラメータ値を、被検出体に関する部分と、当該被検出体を除く環境部分に分解し、当該環境部分を当該被検出体の外部パラメータ値とし、前記検知される外部パラメータ値に基づいて被検出体の内部パラメータ値を特定するための情報を記憶した辞書情報を用いて、前記認識された行動の前後に検知された外部パラメータ値から前記被検出体の内部パラメータ値を推定させ、前記認識された行動と、当該行動の前後に検知された前記被検出体の外部パラメータ値と、当該行動の前後に検知された外部パラメータ値から前記辞書情報を用いて推定された前記被検出体の内部パラメータ値と、を一組の連関情報として生成させ、この生成された連関情報が前記連関データベース手段に記憶されていなければ記憶させる機能と、を有する。
また、本発明のコンピュータプログラムは、所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるコンピュータプログラムであって、前記擬似生物周囲の状況を外部パラメータ値として検知させる機能と、前記擬似生物の擬似的感情を内部パラメータ値として保持させる機能と、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させる機能と、前記選択された連関情報に基づいて前記擬似生物に行動させる機能と、前記連関データベース手段に記憶された前記連関情報から、行動後の外部パラメータ値及び内部パラメータ値が略同一のパラメータ値を有する複数の前記連関情報を抽出させ、前記抽出された前記連関情報のうち、遷移確率が抽出された他の前記連関情報よりも下回る前記連関情報の前記行動前の前記外部パラメータ値及び内部パラメータ値を第1のパラメータ値とし、この他の前記連関情報の前記行動前の前記外部パラメータ値及び内部パラメータ値を第2のパラメータ値とし、前記第1のパラメータ値と、前記第1のパラメータ値を前記第2のパラメータ値へと変化させる行動と、第2のパラメータ値と、所定の初期値に設定された遷移確率と、を一組の連関情報として生成させ、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶させる機能と、を有する。
また、本発明のコンピュータプログラムは、所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるコンピュータプログラムであって、前記擬似生物周囲の状況を外部パラメータ値として検知させる機能と、前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持させる機能と、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させる機能と、前記選択された連関情報に基づいて前記擬似生物に行動させる機能と、
前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報と、を抽出させ、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情が、前記第2の連関情報の行動後の前記擬似 生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記第2の連関情報までの行動と、前記第2の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成させ、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶させる機能と、を有する。
また、本発明のコンピュータプログラムは、所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるコンピュータプログラムであって、前記擬似生物周囲の状況を外部パラメータ値として検知させる機能と、前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持させる機能と、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させる機能と、前記選択された連関情報に基づいて前記擬似生物に行動させる機能と、前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報と、この第2の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第3の連関情報とを抽出させ、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情が、前記第3の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記第2の連関情報の行動及び前記第2の連関情報から前記第3の連関情報までの行動と、前記第3の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成させ、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶させる機能と、を有する。
また、本発明のコンピュータプログラムは、所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるコンピュータプログラムであって、前記擬似生物周囲の状況を外部パラメータ値として検知させる機能と、前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持させる機能と、現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させる機能と、前記選択された連関情報に基づいて前記擬似生物に行動させる機能と、前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報とを1連鎖とするn(ただしnは2以上の自然数)連鎖なる(n+1)個の前記連関情報を抽出させ、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情が、前記n連鎖目の第(n+1)の連関情報の行動後の前 記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記第(n+1)の連関情報までの(n+1)個の前記行動を、(n+1)個の前記連関情報が並べられた順序で行う行動と、前記第(n+1)の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成させ、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶させる機能と、を有する。
【0031】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照して説明する。
【0032】
本発明の疑似生物装置が提供する擬似生物は、その外形として擬人的もしくは擬生物的な形態を有しており、例えば動物の形状であればハムスター、ネコ、サル、イヌ、ウサギ、オウム、クマ、クジラ等を模したものであり、植物であればヒマワリ、カエデ、スウィートバジル等を模したものである。
【0033】
また、そのため、本発明の擬似生物装置は、その実施の形態として、擬似生物の姿形を表示可能なコンピュータ(電子機器)であったり、擬似生物を象ったロボットであったりする。
【0034】
図1乃至図4は本発明に係る疑似生物システムをロボットにて実施した第1の実施形態を示すものである。
【0035】
図1はイヌ形状のロボットの斜視図である。
【0036】
ロボット1の外形は略イヌであり、複数の可動部と本体とからなる。可動部は、頭部2、右腕部3、左腕部4、右足部5、左足部6、しっぽ7からなる。本体は、胴体部8である。また胴体部8には、頭部2、右腕部3、左腕部4、右足部5、左足部6、しっぽ7が関節を介して接続され、胴体部8に対して運動可能である。この関節には、駆動力を発生するモータ、モータの駆動力が伝達されて駆動された各部の時々刻々の姿勢(関節角度)を検知する角度センサ、が設けられる。
【0037】
また、頭部2には、目に該当する個所に発光色の異なる点滅可能なLED9や撮像カメラ10や赤外線式距離センサ11、耳に該当する個所にはマイク12、口に該当する部分にはスピーカ13、額に該当する個所には感圧センサ14、がそれぞれ設けられる。なお、口に該当する個所と耳に該当する個所は所定の方向に運動可能である。
【0038】
また、右腕部3、左腕部4、右足部5、左足部6、しっぽ7、胴体部8にもそれぞれ感圧センサ14が設けられる。
【0039】
次に、図2はロボットのブロック構成図である。
【0040】
胴体部8には、制御部15が内蔵される。制御部15は、CPU16と、ROMとRAMからなるメモリ17とからなる。CPU16は、各可動部に設けられた各種センサ(撮像カメラ10、赤外線式距離センサ11、マイク12、スピーカ13、感圧センサ14、角度センサ)からの信号を受け取り、また各関節のモータを駆動させるための信号を出力できるように接続されている。
【0041】
次に、本発明の機能を図3の本発明の機能を説明するためのブロック線図を用いて説明する。
【0042】
このロボットの機能を「行動発現能力」、「行動形成能力」の2点について説明する。
・行動発現能力
行動発現能力を機能させるための構成は、状況入力部21、連関データベース部22、行動検索部23、行動出力部24である。
【0043】
状況入力部21は、各種センサ(ロボット1の各可動部、本体に設けられた撮像カメラ10、赤外線式距離センサ11、マイク12、感圧センサ14、各関節の角度センサ)、各種センサからの信号を受け取り処理するCPU16、信号およびその処理結果を記憶保持しておくメモリ17の一部により実現される。すなわち、各種センサからの信号を認識する処理がCPU16により実行される。
【0044】
また、連関データベース部22は、メモリ17の一部を使って実現される。
【0045】
また、行動検索部23は、CPU16により実現される。
【0046】
また、行動出力部24は、各種出力デバイス(LED9、スピーカ13、各関節のモータ)、各種出力デバイスを制御するCPU16、その制御のための情報を記憶するメモリ17の一部により実現される。すなわち、ロボットの動作や表情表出を各種出力デバイスを介して出力する処理がCPU16により実行される。
【0047】
まず、状況入力部21は、ロボット1内外の状況データを得る。この状況データはM(Mは自然数)個のパラメータ値を有し、このM個のパラメータはロボット1の外界から得られる情報に関する外部状態パラメータ(外部パラメータ値)と、ロボット1の内部の状態を示す内部状態パラメータ(内部パラメータ値)とから成っている。
【0048】
外部状態パラメータは、撮像カメラ10、静電容量式距離センサ11、マイク12、感圧センサ14によって検知され、被検出体の存在、被検出体の感情状態や行動、被検出体もしくはロボット1自体の行動に対する結果、ロボット1が検知した周囲の環境の状態である。例えば、被検出体とは人間などであり、被検出体の感情状態とは人間の喜怒哀楽などであり、被検出体の行動とは人間が走る行動であり、また行動に対する結果とは人間が走った時に何かにぶつかったという状態であり、また環境の状態とはロボット1の周囲のどの方向に何人の人間が存在するか、といったことである。
【0049】
内部状態パラメータは、外部状態パラメータ及び経過時間の影響を受けて状況入力部21内部で形成されるロボット1独自の擬似的感情や欲求、被検出体に対するロボット1の好悪判断結果、ロボット1が行った行動、ロボット1が行動中か否かである。例えば、欲求とは時間の経過と共に発生する空腹感等の欲求であり、また擬似的感情とは空腹感を有した時に感じるイライラする感情であり、また行動とは被検出体が人間であると判断した時に近付く行動であり、また行動中であるか否かとは被検出体を検知した後被検出体に近付いているか否かであり、また被検出体が人間であった場合被検出体に近接して頭部2を撫でられた(感圧センサ14が検知する押圧力が小さく長い時間接触あり)時にロボット1に生成させる満足感なる感情と撫でた人間の顔の記憶、といったことも含む。
【0050】
このような外部状態パラメータ及び内部状態パラメータは、ロボットが扱うことのできる事象や事物や行動などを識別するためのID番号等の記号データと、ロボットの擬似的感情や欲求の強度値を表す数値データで示される。
【0051】
記号データについては、以下の表1のとおりである。
【表1】

Figure 0003854061
また、数値データとしては、以下の表2のとおりである。強度値の範囲は例えば0〜255の256段階とする。
【表2】
Figure 0003854061
数値データを記載するパラメータがK個(K≦M)あった場合には、これらのパラメータはひとまとめにしてK個のスカラ量から成る一本のK次元ベクトルとして扱うことが可能である。さらに、数値データの各パラメータには各々その重要度に応じた重みが予め定義されており、各パラメータ値は所定の重み係数を乗じられた後にベクトルとしてまとめられ、さらにそのベクトルの長さ(ノルム)を1に正規化される。この正規化されて生成されたベクトルを状況ベクトルと定義すると、この状況ベクトルの向きによって数値データが示している状況の特徴を表すことができる。
【0052】
この状況データたるM個のパラメータと、そのうちのK個の数値データから生成される一本の状況ベクトルとから構成されるデータを状況情報と呼ぶことにする。
【0053】
この状況情報は、所定周期Tで定期的に検知形成され、メモリ17内に設けられたリングバッファに最新のL周期分、すなわち期間(T×L)相当分が記憶されていく。すなわち、新たな状況情報が検知形成されると、リングバッファの最も古い状況情報が破棄されて、最新のものに置き換えられる。このリングバッファに蓄積されている最新L周期分の状況情報の羅列を状況情報列と呼ぶことにする。
【0054】
また、後述するロボットの行動形成のために、状況入力部21には、状況情報列を記憶するリングバッファが3つ用意されている。
【0055】
1つめは、状況入力部21による定期的な状況情報の形成に伴って更新される最新の状況情報列を記憶しておくためのリングバッファ1である。2つめは、ロボットの行動開始直前までの状況情報を記憶しておくためのリングバッファ2である。そして、3つめは、ロボットの行動完了直後からの状況情報を記憶しておくためのリングバッファ3である。
【0056】
リングバッファ1は、ロボット内外の現在の状況を表すものである。また、リングバッファ2は、ロボットが行動を開始した時点でリングバッファ1の全内容を複写したものであり、後述する行動前の実際の状況Jicはこのリングバッファ2の内容として読み出される。そして、リングバッファ3は、ロボットが行動を完了した時点からL周期分の状況情報をリングバッファ1の更新に伴って写し取ったものであり、後述する行動後の実際の状況Jdcはこのリングバッファ3の内容として読み出される。つまり、リングバッファ2と3は、行動の前後の状況を記憶しておくためのバッファであり、ロボットは、自己の行動の前後が実際にどのような状況であったかをここから読み出して利用することができる。
【0057】
連関データベース部22には、連関情報R(後述)が記憶されている。連関データベース部22はメモリ17の一部を使用して形成されており、メモリ17には、この他に、各種センサからの信号によって使用者や机等の事象や事物をロボットが認識するためのパタン辞書情報、ロボットの行動(動作や表情表出)に必要な身体制御情報と出力用音データ、状況入力部21により形成される外部状態パラメータと内部状態パラメータから形成される状況情報列を保持するためのリングバッファ1〜3、その他ロボットを動作させたり学習させたりするための各種暫定的あるいは恒久的情報が記憶されている。
【0058】
連関情報Rとは、ある状況Jiから他の状況Jdへと状況を変化させる行動Acが存在するとき(Ji+Ac→Jdと記述)、Jiを表す状況情報列と、Jdを表す状況情報列と、Acを表す一つの行動情報とを1組とする情報から構成されたものであり、R=[Ji,Ac,Jd]と記述される。連関情報が擁する状況JiやJdは、各々の状況下において状況入力部21が観測するであろうL周期分の状況情報の羅列(状況情報列)であり、このような状況情報列が観測されたらそれはJiやJdであるということを示す見本データである。
【0059】
このときのJiを初期状況、Jdを目的状況、JiからJdへの遷移を起こす行動Acを状況遷移行動と呼ぶことにする。状況遷移行動Acは、上述の表1に例示した単位動作(行動素片)を識別するためのID情報(例えば表1の0002「歩く」)と、このID情報で識別される行動の単位動作(行動素片)を実行するタイミング情報(例えば0秒後)と、必要に応じて付加される行動の対象(例えば表1の0001「使用者」)などを表す動作パラメータ情報とから成る行動素片情報を一つ以上含んだリストとして構成される。例えば、連関情報とは下記のようなものである。
【0060】
Figure 0003854061
また、状況遷移行動Acは、歩く、吠える、見回す等の単位動作を指示する行動素片情報を一つ以上含んでおり、この行動素片情報が複数個、例えば「歩きながら声の主を探す(行動素片情報は、歩く、声の主を探すの2つ)」というようなものであっても構わない。さらに、状況Jiによっては何もせず待つだけで自動的に状況Jdに至ることもあり、対象を特定しない行動素片「待つ」を1つだけ持つ行動情報Acは結果として何もしないという行動を表す。
【0061】
次に、行動検索部23は、状況入力部21から出力された現在の状況Jicと、連関データベース部22に記憶された連関情報R=[Ji,Ac,Jd]の初期状況Jiとを比較する。
【0062】
比較は、現在状況Jicと初期状況Jiとから計算されるスコア情報Scを求めることで行う。現在状況Jicに対する連関情報Rのスコア情報Sc(Jic,R)は、状況適合度A(Jic,R)、状況改善効果E(R)、遷移確率S(R)、実行容易度W(R)の4つのパラメータを有し、Sc(Jic,R)=[A(Jic,R),E(R),S(R),W(R)]のように表す。複数の連関情報Rの中からスコア情報Sc(Jic,R)=[A(Jic,R),E(R),S(R),W(R)]に基づいて一つの解連関情報が抽出される。
【0063】
ここで、4つのパラメータA(Jic,R),E(R),S(R),W(R)の算出方法について説明する。
(1)状況適合度A(Jic,R)
2つの状況JaとJbの類似性を評価する尺度として状況類似度Sj(Ja,Jb)を定義する。状況JaとJbの状況類似度Sj(Ja,Jb)は、JaとJbのそれぞれが持つ((M-K)×L)個の記号データの類似度Sk(Ja,Jb)と、JaとJbのそれぞれが持つ(K×L)個の数値データの類似度Sv(Ja,Jb)の積、すなわちSj(Ja,Jb)=Sk(Ja,Jb)×Sv(Ja,Jb)として計算される。
【0064】
記号データ情報の類似度Sk(Ja,Jb)は、JaとJbが各々擁している各時刻(M-K)個でL周期分の記号データがお互いに一致する個数を((M-K)×L)で正規化した値として計算される。このSk(Ja,Jb)の値の範囲は{Sk (Ja,Jb):0≦Sk (Ja,Jb)≦1}である。このとき、Sk(Ja,Jb)が1に近いほど2つの状況JaとJbの記号データは一致しており、逆に0に近いほど相違している。
【0065】
また数値データの類似度Sv(Ja,Jb)は、JaとJbが各々擁している各時刻の状況ベクトルVaとVbの内積{Ip=(Va・Vb):-1≦Ip≦1}をL周期分平均した値として求められる。状況ベクトルを構成する数値データの値は0以上なので、全ての状況ベクトルは必ずK次元超空間の第1象限にあり、そのような2つの状況ベクトルVaとVbの成す角は0度から90度までである。したがって、実際にはVaとVbの内積値の範囲は{Ip=(Va・Vb):0≦Ip≦1}であり、そのL周期分を平均して求められるSv(Ja,Jb) の値の範囲も{Sv(Ja,Jb):0≦Sv(Ja,Jb)≦1}となる。このSv(Ja,Jb)が1(すなわち成す角0度で完全に一致)に近いほど2つの状況JaとJbの数値データは一致しており、逆に0(すなわち成す角90度で完全に直交)に近いほど相違しているということになる。
【0066】
状況類似度Sj(Ja,Jb)は、Sk(Ja,Jb)×Sv(Ja,Jb)として求められる。状況類似度Sj(Ja,Jb)の値の範囲は、{Sj(Ja,Jb):0≦Sj(Ja,Jb)≦1}であり、このSj(Ja,Jb)が1に近いほど2つの状況JaとJbは記号面でも数値面でも一致しており、逆に0に近いほど相違している。
【0067】
ここで、遷移前の実際の状況Jicと連関情報 R=[Ji,Ac,Jd]の初期状況Jiとの間の状況類似度Sj(Jic,Ji)を状況適合度A(Jic,R)と定義する。このA(Jic,R)が所定閾値以上あれば、現在状況Jicは連関情報Rの初期状況Jiによく似ており、この状況JicにおいてRの指示する行動Acを行うことにより、Rが示している目的状況Jdに至れる可能性があることになる。なお、遷移後の実際の状況Jdcと連関情報R=[Ji,Ac,Jd]の目的状況Jdとの間の状況類似度Sj(Jdc,Jd)を遷移達成度B(Jdc,R)と呼ぶことにする。これは、遷移後の実際の状況Jdcが、目的とした状況Jdにどれだけ一致しているか、すなわち目的の遷移がどれだけよく達成されたのかを計る尺度である。このB(Jdc,R)が所定閾値以上あれば、遷移後の状況Jdcは連関情報Rの目的状況Jdによく似ており、Rの指示する行動Acを行うことにより、Rが示している目的状況Jdに至れた、すなわち遷移が成功したということになる。
(2)状況改善効果E(R)
ある連関情報R=[Ji,Ac,Jd]に関する状況改善効果E(R)は、Rが示す状況遷移行動Acの前後(JiとJd)でロボット1の快感情強度Cがどのように変化するかを求めたものである。この快感情強度Cは、内部状態パラメータ中の擬似的感情と欲求とから求められたロボットの快感情を示すパラメータであり、状況Jに対してC(J)のように記述される。
【0068】
ロボット1の快感情は、外界に存在する被検出体に対する好悪判断結果や欲求充足状況に応じて変化する。例えば、ロボットが好きな物や好きな相手を発見した場合、好きな相手と協調したり嫌いな相手に逆らったりした場合、欲求充足可能な対象を検知した後に実際に欲求が充足された場合、快感情強度Cの値を上昇させる。この時のCの上限は1とする。また、その逆の状況で、ロボットが嫌いな物や嫌いな相手を発見した場合、好きな相手と協調できなかったり嫌いな相手に利してしまったりした場合、欲求充足可能な対象を検知した後で充足前にその対象が消失してしまったりした場合、快感情強度Cの値を低下させる。この時のCの下限は-1とする。
【0069】
このように快感情強度C(J)は、ロボット1にとっての状況Jの好ましさを評価する尺度として機能する。そして連関情報R=[Ji,Ac,Jd]の目的状況Jdと初期状況Jiにおける快感情強度C(Jd)とC(Ji)との差{E(R)=C(Jd)-C(Ji):-2≦E(R)≦2}が正に大きいほど、状況の好ましさが状況遷移行動Acによって大きく改善されることを表している。
(3)遷移確率S(R)
ある連関情報R=[Ji,Ac,Jd]に関する遷移確率S(R)は、その連関情報R=[Ji,Ac,Jd]がどのくらいの確率で正しいか(成立するか)を表したものである。これは外界における不確定要素のために、連関情報Rに記述された状況遷移行動Acを初期状況Jiにおいて実行しても確実に目的状況Jdに到達できるかどうか分からないからである。状況遷移行動Acを行って目的状況Jdに達した時は、遷移が成功した(連関情報が成立した)、つまりこの連関情報Rは実際に起こる遷移(Ji+Ac→Jd)を正しく示していたということになる。
【0070】
遷移確率S(R)は、{S(R):0≦S(R)≦1}の値の範囲で連関情報ごとに計算される。連関情報Rに関する遷移確率S(R)と記述され、その連関情報Rの実行回数Nt(R)と実際にその遷移が成功した回数Ns(R)との商S(R)/=Ns(R)/Nt(R)として計算される。ただし、連関情報Rがまだ一度も実行されていない初期状態ではNt(R)=0、Ns(R)=0なので商Ns(R)/Nt(R)を定義できない。この場合の遷移確率はS(R)=0であるとする。連関情報R に関するNt(R)、Ns(R)、S(R)をまとめて遷移確率情報Si(R)=[Ns(R),Nt(R),S(R)]として表す。
(4)実行容易度W(R)
ある連関情報R=[Ji,Ac,Jd]に関する実行容易度W(R)は、連関情報Rが指示する行動Acの実行に係るコストがどれくらい低いか、すなわち行動Acがどれだけ実行しやすいかを計る尺度である。実行容易度W(R)は、行動Acを構成する行動素片の数(最低でも1個)の逆数{U(Ac):0≦U(Ac)≦1}として計算される。ここで、U(Ac)を行動Acの省力指数と呼び、行動Acが少ない動作で完了するほど大きくなる。実行容易度W(R)の値の範囲は{W(R):0<W(R)≦1}であり、W(R)が大きいほど行動Acは少ない動作で完了する簡単な行動であることを表している。
【0071】
このような(1)〜(4)を求めた上で、一つの解連関情報Rを抽出する。具体的には、状況適合度A(R)が所定閾値以上あり、かつ状況改善効果E(R)と遷移確率S(R)と実行容易度W(R)の積、すなわち状況改善期待度{Ep(R)=E(R)×S(R)×W(R):-2≦Ep(R)≦2}が所定閾値以上かつ最大となるものが選択される。つまり選択された解連関情報は、現在の状況Jiに対してロボットが知っている適用可能な(状況適合度Aが所定閾値以上)行動のうち、少ない労力で状況が改善される最も良さそうな(状況改善期待度Epが所定閾値以上で最大となる)行動である。
【0072】
次に、行動出力部24は、行動検索部23にて選択された解連関情報に基づいて、所定のタイミングで行動素片情報の内容を実行する。
【0073】
例えば、ロボットが室内にひとりで居て寂しかったとする(状況Jic)。上述したスコア情報Scを計算し、この状況Jicに類似する初期状況を持つ連関情報(候補連関情報)を連関データベース部22から抽出する。抽出された連関情報が、例えば、下記の3つあったとする。
【0074】
Figure 0003854061
このとき、状況改善期待度Epの閾値が0.1であったとすると、この中から閾値を越え最大の状況改善期待度Ep=0.5を持つ連関情報R2が状況Jicを最も改善する解連関情報として選択される。
【0075】
ロボットは選択された解連関情報R2に従って、スピーカ13から吠え声を出力しながら各可動部のモータを動かして吠える身体動作を行う。
・行動形成能力
行動形成能力を機能させるための構成は、信頼性学習部25、目標外行動学習部26、他者行動学習部27、状況調整行動学習部28、連鎖行動学習部29である。
【0076】
信頼性学習部25、目標外行動学習部26、他者行動学習部27、状況調整行動学習部28、連鎖行動学習部29は、専ら制御部15内のCPU16とメモリ17の一部により実現される。すなわち、これらの構成要素が行う処理はCPU16により実行される。
【0077】
この行動形成能力には、更に以下の4つの能力がある。
1.行動探索能力
2.行動複製能力
3.状況調整能力
4.行動計画能力
上述の各能力は、1に対して信頼性学習部25と目標外行動学習部26、2に対して他者行動学習部27、3に対して状況調節行動学習部28、4に対して連鎖行動学習部29がそれぞれ対応して動作を行う。
【0078】
まず、各能力について説明する。
(行動探索能力)
行動探索能力は、前述した行動検索部23と後述する信頼性学習25と目標外行動学習部26によって実行される。
【0079】
ある状況Jicに遭遇したロボットが、その状況において適用可能(状況適合度Aが所定閾値以上)で、かつ、少ない労力で状況改善効果を期待できる(状況改善期待度Epが所定閾値以上)行動(連関情報)をその連関データベース部22に一つも記憶していなかったとすると、行動検索部23は解連関情報を選択することができない。なぜなら、連関データベース部22には、状況Jicにおいて適用可能であっても状況を少ない労力で改善できる見込みの少ない(状況改善期待度Epが所定閾値未満)行動か、状況Jicにおいて適用可能でない(状況適合度Aが所定閾値未満)行動しか記憶されていないからである。そこで、行動検索部23はこのような場合に限り、連関データベース部22から乱数により一つの連関情報を(暫定的な)解連関情報として選択する。
【0080】
選択された連関情報R=[Ji,Ac,Jd]が状況Jicにおいて適用可能(状況適合度A(Jic,R)が所定閾値以上)であり、その行動Acが実行された後の状況Jdcが目的状況Jdに十分類似していた(遷移達成度B(Jdc,R)が所定閾値以上)場合にはその遷移確率S(R)を増加させる。逆に、選択された連関情報Rが適用可能であるにも関わらず、その行動Ac実行後の状況Jdcが予定された目標状況Jdに類似しなかった(遷移達成度B(Jdc,R)が所定閾値未満)場合には遷移確率S(R)を減少させ、それとともに、実際の遷移(Jic+Ac→Jdc)を表す新たな連関情報(目標外行動連関情報)R1=[Jic,Ac,Jdc]を生成し、その遷移確率情報Si(R1)=[Ns(R1),Nt(R1),S(R1)]を1回の試行で1回成功していることを表す[1,1,1]に設定し、これらR1とS(R1)を連関データベース部22に記憶することで遷移(Jic+Ac→Jdc)を知識化する。
【0081】
また、選択された連関情報R=[Ji,Ac,Jd]が状況Jicにおいて適用可能でない(状況適合度A(Jic,R)が所定閾値未満)場合には、元々初期状況Jiが実際の状況Jicに類似していないのだから、この連関情報Rの正しさを示す尺度たる遷移確率S(R)を変更せず、実際の遷移(Jic+Ac→Jdc)を表す新たな連関情報(目標外行動連関情報)R1=[Jic,Ac,Jdc] を生成し、その遷移確率情報Si(R1)=[Ns(R1),Nt(R1),S(R1)]を1回の試行で1回成功していることを表す[1,1,1]に設定し、これらR1とS(R1)を連関データベース部22に記憶することでこの遷移の知識化のみを行う。
【0082】
このように、状況改善期待度が低かったり適用できなかったりと、その効果のほどが危ぶまれる連関情報から一つの連関情報Rを選択してその結果を確かめることにより、選択された連関情報Rの遷移確率S(R)を変化させたり(後述する信頼性学習部25による)、実際に起こった遷移を知識化するための新たな連関情報(目標外行動連関情報)R1を生成する(後述する目標外行動学習部26による)などして、行動Acの新たな側面をロボットは知ることができる。そして、適用可能な連関情報を試した場合、結果として遷移確率S(R)が増加された連関情報Rは、状況Jicに類似した状況において優先的に選択されるようになり、遷移確率S(R)が減少された連関情報Rは、状況Jicに類似した状況においてますます選択されにくくなる。すなわち、ある状況下で成立する連関情報(遷移確率Sが増大)や成立しない連関情報(遷移確率Sが減少)が明らかにされていく。また、適用可能/不可能を問わず、このように適宜選択された連関情報Rを実行した結果、その状況下で成立する新たな連関情報(目標外行動連関情報)R1が明らかにされる。すなわち、行動によりどのような状況がもたらされるかという知識が、状況を改善できたもの(成功例)も、改善できなかったもの(失敗例)も連関情報の形で連関データベース22に蓄積されていく。
【0083】
以上述べた行動探索能力とは、ロボットが動作を開始し始めた初期段階、適用可能な全ての連関情報の遷移確率Sがまだ小さい時期に特に発揮されるものである。また使用期間が長くなったとしても連関情報に記述される初期状況の発生頻度が少なくて十分な試行が為されていない場合も同様である。あるいは、使用場所や使用者が変わるなどのようにロボット周囲の環境が激変したために、ロボットが擁している連関情報の多くが適用不可能になったり成立しなくなったりした場合も同様である。特定の状況で選択可能な行動が固定的に与えられている従来のロボットでは、このような劇的な環境の変動に対処することができなかった。
【0084】
この行動探索能力は次のように働く。例えば、使用者に叱られたロボットがこの使用者から逃げようとするが、さらに追いすがられて叱られたという状況を考える。ロボットは叱られているという状況Jicにおいて適用可能な連関情報として、「逃げる」を行動情報Ac1に持つ下記の連関情報R1だけを連関データベース部22に記憶していたとする。
【0085】
Figure 0003854061
当然、ロボットはこの連関情報R1を実行するが、使用者に追いすがられることによって、この連関情報R1が示唆する「逃げ切れた」状況Jd2に至らず、この連関情報R1がここで役に立たないことを知らされる。そして、この連関情報R1の遷移確立S(R)は減少し、何度かこのようなことを繰り返すうちに連関情報R1の遷移確率S(R)は極めて小さくなり、状況改善期待度Ep(R)が所定閾値を下回ったとき、もはやこの連関情報R1を実行することができなくなる。もちろん、このときロボットは他に有力な連関情報を持っていないので、何も実行することができない。そこで、行動探索能力により、ロボットは他の連関情報を試すことになる。おそらく幾つかの無駄なあがきをした後に、ロボットはたまたま全く別の初期状況「嬉しい」で選択される「踊る」を行動情報Ac2に持つ下記の連関情報R2を実行する。
【0086】
Figure 0003854061
R1とR2の初期状況Ji1とJi2は全く異なる。「踊る」行動Ac2は通常なら「叱られている」状況では絶対に選択されない行動である。しかし、行動探索能力によりロボットが「踊りだした」結果、使用者はその怒りをはぐらかされて追及を止めてしまったとする。その結果、ロボットは「使用者に叱られている」初期状況で、行動「踊る」を実行することにより、「叱られなくなる」状況に至れることを実際に経験することで初めて知る。そして、この経験は下記に示す新たな連関情報(目標外行動連関情報)R3として連関データベース部22に追加され、ロボットの今後の行動に影響を与えるようになる。
【0087】
Figure 0003854061
ここで各種センサがどのような信号を検知するかは予めメモリ17に記憶されているとする。例えば、使用者がロボットの頭部を叩いて叱ることは、ロボット頭部の感圧センサに所定値よりも大きな力が所定時間よりも短く検知される状態としてロボットに認識され、使用者がロボットを怒鳴って叱ることは、ロボットのマイクに所定値よりも大きな音声が検知される状態としてロボットに認識される。
【0088】
なお、この例でもわかるように、ロボットが試すことのできる行動は連関情報として連関データベース部22に記憶されている行動に限定されており、それを逸脱した行動を実行することはできない。行動探索能力はあくまでも既知の行動の新たな効果を知るための経験能力である。
(行動複製能力)
上記行動探索能力によって、ロボットは既知の行動(例えば「踊る」)の新たな効果、すなわち予測できなかった遷移を実際に起こった遷移から発見することができるようになった。この結果、ロボットは行動の内容自体を増やすことはできないものの、行動を使いこなす知識を増やすことができるようになる。しかしながら、まだロボットは新たな行動を発見することはできない。
【0089】
一方、後述する他者行動学習部27によって実行される行動複製能力は、ロボットが、自己の周囲で他者が行う未知の行動を観察し、「この状況でこうすればこうできるのだ」という情報を得て、これを新たな連関情報(他者行動連関情報)Rとして連関データベース部22に記憶していくことで、自己の新たな行動を獲得する行動模倣の能力ある。
【0090】
例えば、使用者Xが泣いていた場合に、別の使用者Yがこの泣いている使用者Xの背中をさすったり抱きしめたりすることで、泣いている使用者Xが泣きやみ笑顔を見せたのをロボットが観察していたとする。
【0091】
この一連の動作をロボットは、撮像カメラ、マイクで検知しており、使用者Xの「泣いている」状況Jiが、使用者Yによる「背中をさすられたり」、「抱きしめられたり」する行動Acによって、「泣きやみ笑顔を見せる」状況Jdに遷移することを認識する。なお、予めメモリ17には、泣いている表情、泣きやむ/泣いていない表情、笑顔等の表情が記憶されており、ロボットが認識できるようになっているものとする。また、背中をさする(行動素片:前肢を対象に接触させる+行動素片:前肢を滑らせる)、抱きしめる(行動素片:対象を両前肢で抱える+行動素片:しばらくそのままでいる)といった行動も、予めメモリ17に記憶されている行動素片の連鎖として認識可能である。
【0092】
そこで、ロボットは、誰かが「泣いている」初期状況Jiを「泣きやむ」もしくは「笑顔を見せる」目的状況Jdに至らせるには、この泣いている人の「背中をさする」、もしくは「抱きしめる」という行動Acによって達成できることを知り、これらJi,Ac,Jdを新たな一組の連関情報(他者行動連関情報)R=[Ji,Ac,Jd]としてまとめ、この他者行動連関情報Rを連関データベース部22に追加して行動それ自体を増加させる。
【0093】
なお、ロボットがこのように見真似により複製することのできる行動は、メモリ17に記憶される行動素片の組み合わせとしてロボットが実行できる行動に限定されており、それを逸脱した行動を複製することはできない。行動複製能力はあくまでも既知の行動素片による既知もしくは新規の組み合わせから成る行動の新たな効果を他者の行動を観察することにより知るための経験能力である。
(状況調整能力)
目的状況が同様の状況Jdを目指しながら、異なる初期状況Ji1とJi2から出発する2つの異なる連関情報R1=[Ji1,Ac1,Jd]とR2=[Ji2,Ac2,Jd]があったとき、初期状況Ji1とJi2の差異や、行動Ac1とAc2の差異によって、R1の遷移確率S(R1)は高く、R2の遷移確率S(R2)が低いということが起こる。つまり、Ji1からならJdに至りやすいが、Ji2からはJdに至ることが稀であるということがある。
【0094】
後述する状況調整行動学習部28により実行される状況調整能力とは、このような遷移が成功しにくい状況Ji2を初期状況とし、遷移が成功しやすい状況Ji1を目的状況とする新たな連関情報(状況調節行動連関情報)R3=[Ji2,Ac3,Ji1]を生成して連関データベース部22に追加し、Ji2からJdに至りやすくする補助的な準備行動を獲得する能力のことである。
【0095】
これは、失敗しやすい連関情報R2=[Ji2,Ac2,Jd]によりJi2からJdへ直接遷移(Ji2+Ac2→Jd)させようとする代わりに、まず状況調節行動連関情報R3=[Ji2,Ac3,Ji1]により失敗しやすい状況Ji2から成功しやすい状況Ji1へ至り、次に連関情報R1=[Ji1,Ac1,Jd]によりJi1から最終目標Jdへ至る2段階遷移(Ji2+Ac3→Ji1+Ac1→Jd)の行動パタンをロボットが学習することである。このとき、状況調節行動連関情報R3は、遷移に失敗しやすい状況Ji2に特有の条件(失敗要因)を取り除き、成功しやすい状況Ji1に特有の条件(成功要因)を実現し、連関情報R1による遷移のお膳立てをする準備行動を表す連関情報である。準備行動が成功すれば、失敗要因を含まず成功要因を含む状況Ji1が実現するので、目的状況Jdへの遷移が成功する可能性が高くなる。
【0096】
例えば、下記の2つの連関情報R1とR2があったとする。
【0097】
Figure 0003854061
このとき、連関情報R1の遷移確率S(R1)が所定値以上あり、連関情報R2の遷移確率S(R2)よりも所定値以上大きかったとする。これは、ソファの後ろよりソファの上の方が使用者を見つけやすいことに由来し、遷移確率Sの違いがそのことを物語っている。失敗要因はソファの後ろにいることであり、成功要因はソファの上にいることである。このとき、ロボットは状況Ji2から状況Ji1に至る下記の新たな連関情報(状況調節行動連関情報)R3を生成する。なお、このR3の遷移確率情報Si(R3)=[Ns(R3),Nt(R3),S(R3)]は、この遷移が未試行なので[0,0,0]に設定される。
【0098】
Figure 0003854061
なお、この例ではロボットの快感情強度Cは増大しないので、この遷移の状況改善効果Eは0である。このように、状況調節能力は状況改善効果Eの優劣に関係なく、準備行動R3をロボットの行動パタンに加える。状況改善期待度Ep(R3)が足りない(遷移確率S(R3)が足りない)準備行動R3の生成当初は、R3は行動探索能力により選択される。特にR2が役に立たないのであるから、同じ初期状況に適合するR3が試行される可能性は高い。
【0099】
このように、同じ目的状況に至るものでありながら、初期状況の異なる2つの連関情報が連関データベース22に記憶されており、一方の遷移確率が十分高く、それに比べて他方の遷移確率が十分低いとき、状況を調節するための新たな連関情報(状況調節行動連関情報)が生成される機能が状況調整能力である。
【0100】
なお、ロボットがこのように準備行動として獲得することのできる行動は、メモリ17に記憶される行動素片の組み合わせとしてロボットが実行できる行動に限定されており、また、成功要因や失敗要因にロボットが制御できない条件、例えば、第三者の存在やその行動がある場合、これを呼び込んだり排除したりする行動を生成することはできない。以上のような制約があるものの、状況調節能力はある行動を成功させるための条件を自ら整えるための準備行動をロボットが知るための経験能力として機能する。
(行動計画能力)
後述する連鎖行動学習部29により実行される行動計画能力とは、連関データベース部22から状況を連続的に結んでいる(一方の目的状況が他方の初期状況とほぼ同一である)連関情報(行動)の連鎖を発見し、もし、そのような連鎖が状況を改善できるならば、この連鎖を表す新たな連関情報(連鎖行動連関情報)を生成して連関データベース部22に追加する能力である。
【0101】
連関情報R1=[Ji1,Ac1,Jd1]の目的状況Jd1と、連関情報R2=[Ji2,Ac2,Jd2]の初期状況Ji2とがほぼ同一(状況類似度Sj(Jd1, Ji2)が所定閾値以上)であるような連関情報が、連関データベース部22内に例えばR2の目的状況Jd2に対してR3の初期状況Ji3がほぼ同一、R3の目的状況Jd3がR4の初期状況Jd4とほぼ同一というようにRnまで連鎖していることが見つかった場合、その連鎖の最初もしくは途中の連関情報Rk(1≦k<n)の初期状況Jikにおける快感情強度C(Jik)の値よりも、Rkの先に連なっている連関情報Rp(k<p≦n)の目的状況Jdpにおける快感情強度C(Jdp)の値の方が大きいときには、連関情報Rk,…,Rpまでを連続して実行する遷移(Jik+Ack+…+Acp→Jdp)により状況が改善可能であるということになる。そこで、ロボットはRk,…,Rpまでを連鎖させた新たな連関情報(連鎖行動連関情報)Rx=[Jik, Ack+…+Acp,Jdp]を生成し、連関データベース部22に追加する。この結果、状況改善可能なロボットの行動パタンが広がる。このとき、連鎖行動連関情報Rxの遷移確率S(Rx)は、連鎖された各連関情報Rk,…,Rpの遷移確率の積で与えられる。なお、複数の連関情報から成る状況改善可能な連鎖は連鎖R1,…,Rnの中から全て抽出されて連関データベース部22に追加される。
【0102】
例えば、前述した状況調節能力により獲得されたR3は、行動計画能力により一層選択されやすくなる。この例では下記のR1とR2とを比較して、準備行動としてR3が生成された。しかし、R3は状況改善効果がなく、このままではごく稀にしか実行されそうにない。
【0103】
Figure 0003854061
行動計画能力は、このR3とR1を組み合わせた下記に示す新たな連関情報(連鎖行動連関情報)R4=[Ji2,Ac3+Ac1,Jd]を生成できる。この連鎖行動連関情報R4は明らかに状況改善効果があり、何回かの試行により遷移確率が上昇すれば、以後、行動検索部23の通常の動作により解連関情報として選択される可能性が高い。
【0104】
Figure 0003854061
なお、以上からも明らかなように、行動計画能力により連鎖される連関情報の個数はいくつであっても良く、また、途中で状況が改悪されることがあっても構わない。要するに、連鎖される一番目の連関情報Rkの初期状況Jikにおける快感情強度C(Jik)の値よりも、最後の連関情報Rpの目的状況Jdpにおける快感情強度C(Jdp)の値の方が大きくなっている部分を連鎖の中から抽出できれば良い。
【0105】
なお、行動計画能力により、それぞれの初期状況がほぼ同一であり、かつそれぞれの目的状況もほぼ同一である遷移を記述する複数の連関情報が連関データベース部22に記憶されるようになっても構わない。この場合、行動検索部23の通常の処理により、含まれる行動素片の個数の少ない方、すなわち実行容易度Wの大きい方が優先的に選択される。無論、実行した結果、遷移確率Sが減少するようなことがあれば、より多くの行動素片を持つ複雑な行動が代わりに現れてくるようになる。そのためにも、そのときは無駄なようでも多くの連関情報を作っておくことが重要なのである。
【0106】
また、連鎖の初期状況と目的状況がほぼ同一となる(ループになっている)連鎖行動連関情報が発見されることもあるが、前述したように、状況改善しない連鎖は生成されないので、初期状況と目的状況が等しい連関情報は生成されない。
【0107】
上述した4つの能力それぞれに対応して動作する信頼性学習部25、目標外行動学習部26、他者行動学習部27、状況調節行動学習部28、連鎖行動学習部29について詳細に説明する。
【0108】
(イ)信頼性学習部25
信頼性学習部25は、ロボットが行った行動の結果を評価して、その行動を記述する連関情報の遷移確率を増減させる動作を行う。すなわち、信頼性学習部25は、前述の行動探索能力を実現する手段の一つである。
【0109】
信頼性学習部25は、状況Jicにおいてロボットが連関情報R=[Ji,Ac,Jd]を選択し、その行動Acが完了して状況Jdcに至った時点で、連関情報Rに記憶された目標状況Jdと完了後の実際の状況Jdcとの状況類似度Sj(Jdc,Jd)、すなわち遷移達成度B(Jdc,R)を求め、これが所定閾値以上であれば、遷移が成功した(連関情報Rは成立した)として、この連関情報Rの遷移確率情報Si(R)=[Ns(R),Nt(R),S(R)]中の実行回数Nt(R)と成功回数Ns(R)をそれぞれ1増加させ、S(R)=Ns(R)/Nt(R)を新しい遷移確率の値としてメモリ17に記憶させる。
【0110】
逆に、遷移達成度B(Jdc,R)が所定閾値未満であれば、遷移は失敗した(連関情報Rは成立しなかった)として、この連関情報Rの遷移確率情報Si(R)=[Ns(R),Nt(R),S(R)]中の実行回数Nt(R)のみを1増加させ、S(R)=Ns(R)/Nt(R)を新しい遷移確率の値としてメモリ17に記憶させる。
【0111】
このような遷移確率の更新(学習)後に、ロボットが、上述した状況Jicと同様の状況において適用可能な連関情報を選択する場合、状況改善効果Eとの関係もあるが、以前よりも遷移確率Sを高くされた連関情報Rが選択されやすくなる。逆に遷移確率Sを小さくされた連関情報Rは選択されにくくなり、その結果行動として現れなくなる。
【0112】
したがって、ロボットは、連関情報を選択して行動をおこし、その遷移の成否によって遷移確率Sを更新していくことで、少しずつ遷移確率の高い連関情報を選択するようになる。
【0113】
なお、注意すべきことは、信頼性学習部25は快感情強度Cの増加ではなく、連関情報が正しかったか否かで行動を評価する点である。これは従来のロボットが行っている強化学習と異なる。ロボットの行動が快感情強度Cの増加にあるとしたとき、強化学習は遷移後に実際に経験する快感情強度C(報酬信号という)の大小によって行動の発現頻度を増減させる。強化学習は行動Acとそれを選択すべき初期状況Jiと行動の発現頻度Sだけを知っている、いわばR=[Ji,Ac]という方式であり、行動の前に目的状況Jdを評価することはしない。
【0114】
したがって、強化学習では、連関情報の通りの遷移が起こらなくても、たまたま快感情強度Cが増加する状況に遷移できさえすれば、それが予定外の遷移であっても発現頻度が増加されてしまう。その結果、実際には、お門違いの状況に遷移させてしまう行動が、その間違いにも関わらずひたすら強化されてしまう。
【0115】
一方、本発明は、同様に快感情強度Cの増加を目的としてロボットを行動させる(この仕組みは行動検索部23が担っている)が、遷移させようとした行動が本当にその通りの結果を生んだかどうかを評価して連関情報の遷移確率Sを増減させる。その結果、連関情報そのものの正しさを把握したうえで行動を選択できるようになるので、行動による細かい状況のコントロールが可能になるのである。本発明によれば、正しい連関情報R=[Ji,Ac,Jd]がありさえすれば、狙った状況Jdをロボットが作り出せるのである。それに比較すれば、強化学習は目をつぶって石を投げているようなものである。
【0116】
(ロ)目標外行動学習部26
目標外行動学習部26は、ロボットが行った行動の結果を評価して、その行動を記述する連関情報が間違っていた場合に、正しい遷移を表す新たな連関情報(目標外行動連関情報)を生成して、連関データベース部22に追加する動作を行う。すなわち、目標外行動学習部26は、前述の行動探索能力を実現する手段の一つである。
【0117】
目標外行動学習部26は、状況Jicにおいてロボットが連関情報R=[Ji,Ac,Jd]を選択し、その行動Acが完了して状況Jdcに至った時点で、連関情報Rに記憶された目標状況Jdと完了後の実際の状況Jdcとの状況類似度Sj(Jdc,J2)、すなわち遷移達成度B(Jdc,R)を求め、これが所定閾値未満であれば、遷移は失敗した(連関情報Rは成立しなかった)として、実際に起こった遷移(Jic+Ac→Jdc)を表す新たな連関情報(目標外行動連関情報)R1=[Jic,Ac,Jdc]を生成し、連関データベース部22に追加する。なお、生成された目標外行動連関情報R1に類似する連関情報が既に連関データベース部22に記憶されていれば追加しない。これは連関データベース部22を類似した多数の連関情報でパンクさせないためである。
【0118】
生成された目標外行動連関情報R1に類似する連関情報が、既に連関データベース部22に記憶されているか否かは以下のような検索を行い判断される。
【0119】
まず、新たに追加される連関情報R1=[Jic,Ac,Jdc]中の状況遷移行動Acと、連関データベース部22に記憶されている各連関情報Rn=[Jin,Acn,Jdn]中の状況遷移行動Acnとを比較し、両者が同一である連関情報Rnを逐次検出する。これは、これから追加しようとする連関情報R1の行動Acと同じ行動を持つ連関情報だけを検出するためである。
【0120】
次に、連関情報R1=[Jic,Ac,Jdc]中の状況Jic,Jdcと、上記検出された連関情報Rn=[Jin,Acn,Jdn]中の状況Jin,Jdnの、初期状況間の状況類似度Sj(Jic,Jin)と目的状況間の状況類似度Sj(Jdc,Jdn)をそれぞれ求め、両類似度がともに所定閾値以上を獲得する場合、追加しようとしている連関情報R1と行動が同じで、初期状況も目的状況も十分類似した連関情報が既に存在しているものと判断し、連関情報R1を連関データベース部22へ追加することを取りやめる。
【0121】
ここで、本発明と従来の強化学習との相違について説明する。
【0122】
従来の強化学習は、選択された行動パタンを実行したロボットの行動の成否(快感情強度Cの増加や減少)で行動の発現頻度を加減していた。つまり、行動の結果、実際に起こった遷移を快感情強度C(報酬信号)のみで評価し、それによって発現頻度のみが学習された。
【0123】
これに対して、本発明の目標外行動学習部26は実際に起こった遷移(Jic+Ac→Jdc)を追加される連関情報R1=[Jic,Ac,Jdc]として学習することができる。つまり、行動Acを発現させる初期状況Jicや、その結果訪れる目的状況Jdcを現実に則して知識化することができる。
【0124】
本発明と従来の強化学習は、ともに状況の改善効果の高い行動の発現頻度を増加させて、改善効果の低い発現頻度を減少させる点においては同一であるが、強化学習では実際の初期状況を学習することは行わないので、「このとき(Ji)はこの行動(Ac)をすべきである」という知識の中の「このとき(Ji)」は固定されており、その固定された知識のもとで、「このときはこっちの行動をした方が報酬を得やすい」ということだけを発現頻度Sの学習によって獲得していく。つまり、R=[Ji,Ac]は固定されていて、学習されることはない。ましてや、目的状況Jdを知識化することはないので、状況の微妙な食い違いに対処する行動パタンを学習できない。
【0125】
これに対して本発明は、状況の微妙な食い違いに対処する行動パタンを学習できる点が強化学習とは異なる。このことは、行動がどのような状況を作り出すのかということに関する知識を蓄積して運用することのできるロボットを構築するために必要である。知識が成立する(連関情報どおりの遷移が起こる)場合には、この知識を適用し続けても問題を生じない。一方、知識が成立しなかった(連関情報どおりの遷移が起こらなかった)場合には、この知識と異なる成立可能な知識を新たに構築する必要が生じる。不成立は初期状況の微妙な違いによるのかもしれないし、あるいは状況情報として観測できなかった不確定要因によるものであるかもしれない。そこで、このような時に、目標外行動学主部26が前後の状況を含めて知識を追加構築することで、本発明は強化学習(状況を知識化しない)を超えた状況適応能力を発揮できるようになる。
【0126】
このように、目標とした事後状況への遷移し易さを信頼性学習部25が学習することに加えて、目標とした事後状況と異なる状況への遷移が存在することを目標外行動学習部26が学習する。強化学習と異なり適用可能な状況や到達可能な状況が細分化されて(連関情報として)蓄積可能なこの仕組みは、従来よりも高い学習適応能力をシステムに与える。
【0127】
目標外行動学習部26は、既知の行動が適用可能な知られていなかった新たな初期状況や、既知の行動が遷移可能な知られていなかった新たな目的状況を知識化するというものである。この結果、システムは知っている行動を新たな効果を期待して適用できる、つまり新たな行動パタン(このときはこの行動ができる)を獲得できるようになるが、知っている行動の数を増やすことはできない。すなわち、目標外行動学習部26は、連関情報中の状況情報を拡充するように動作する。つまり、ここで行われる学習は新しい行動情報を獲得するというものではない。
【0128】
行動検索部23と信頼性学習部25と目標外行動学習部26の連携により、ロボットは前述した「行動探索能力」を発揮することができる。すなわち、このロボットが十分な状況改善効果を持つ行動を記憶していない場合であっても、行動検索部23の働きにより、何らかの行動を試してみることができる。このような試行は、信頼性学習部25と目標外行動学習部26の働きを通じて、状況改善の成否に関わらずその結果が今後の行動に影響を与える知識として蓄積される。
【0129】
特に連関情報通りの遷移が行われなかった場合には、新たな連関情報が構築されるため、知識とは異なる状況に到達しても、それが新たな連関情報として知識化され、このロボットの状況適応能力が向上する。
【0130】
上述したような行動探索能力をロボットに発揮させるためには、最初に幾つかの種となる行動パタン(連関情報)を連関データベース部22に記憶させておく必要がある。この記憶された行動パタンが充実している(数が多い)ほど、ロボットが対応できる、あるいは対応できるようになる状況が多くなる。
【0131】
しかしながら、どのような行動を行っても状況が改善されない場合には、このロボットは無駄な行動を延々と続けるだけである。これが行動それ自体を拡充する能力を持たないロボットの状況対応能力の限界である。さらなる状況対応能力をロボットに発揮させるためには、状況遷移行動自体を増やすような学習機能が必要である。
【0132】
(ハ)他者行動学習部27
他者行動学習部27は、使用者などの他者が行った行動を新たな連関情報(他者行動連関情報)として連関データベース部22に記憶させ、ロボットの行動パタンの一つとする動作をする。すなわち、他者行動学習部27は、前述の行動複製能力を実現する手段である。
【0133】
より詳しくは、状況入力部21が、ロボットに設けられたマイクや撮像カメラにより他者の音声や行動(態度)や表情などを認識し、この行動の前後でその他者の状況がどうであったかを推定する。他者の状況には、観察によって即座に検知可能な外部状態パラメータの他に、推定を要する感情などの内部状態パラメータも含まれる。内部状態パラメータの推定は、入力された他者の音声や行動(態度)や表情をもとにして行われ、予めメモリ17にそれらを認識するための辞書情報が記憶されている。この辞書情報の内容は、顔の表情、身振り手振り等の行動(態度)、音声の語気などを撮像された画像や取り込まれた音声から検出し、そこから読み取れる内部状態パラメータを特定するための情報である。この結果、例えば、ある行動によって怒った表情の画像から笑った表情の画像に変われることが観察されれば、他者の感情状態が怒りから喜びに変化したと推定される。推定された結果は、状況情報列に記憶される。
【0134】
他者行動学習部27は、状況入力部21による状況情報列の中に他者の行動Acを検出すると、次の2つの場合に分けて動作する。
【0135】
(1)行動Acがロボットを対象に行われた場合
通常、状況入力部21によって、他者の感情状態や行動はロボットの外部状態として扱われ、ロボットの感情状態や行動はロボットの内部状態として状況情報にまとめられている。行動Acはロボットを対象に他者によって行われたものであるから、その彼我の関係をひっくり返せば、他者を対象にしたロボットの行動として捉えなおすことができるはずである。
【0136】
ロボットの周囲状況として観測される外部状態パラメータは、(a)行為者たる他者に関する部分と、(b)他者を除く環境部分の2つに分解できる。(a)は行為者たる他者の表情や行動や態度及び、それらからロボットが推定することのできたこの他者の感情や欲求である。また、(b)は例えば周囲の樹木や物体など、ロボットと他者の双方にとって共通の環境部分である。また、ロボットの内部状態パラメータは、(c)ロボットの感情や欲求を表す内部状態パラメータである。
【0137】
このとき、他者から見た外部状態パラメータは、前記(b)、(c)に加えて、実際にはロボットが存在するのだが、これを何らかの他者がいるというように置き換えた記号データから合成される。また、他者の内部状態パラメータは、前記(a)ということになる。
【0138】
そこで、他者行動学習部27は、行動Acの前後の状況を示す状況情報列JiとJdの各々を上記(a)、(b)、(c)に分解して再編成することにより、行動Acの前後の状況を他者の視点から捉えた他者状況情報列Ji'とJd'とし、Ji'を初期状況、Jd'を目的状況、Acを状況遷移行動とする新たな連関情報(他者行動連関情報)R=[Ji',Ac,Jd']を生成して連関データベース部22に追加する。なお、生成された他者行動連関情報Rに類似する連関情報が既に連関データベース部22に記憶されていれば追加しない。なお、この他者行動連関情報Rに類似する連関情報が連関データベース部22に存在するか否かの検索は、目標外行動学習部26で行われた検索と同様である。
【0139】
(2)行動Acが他者間で行われた場合
状況入力部21によって、他者Xと他者Yの感情状態や行動はロボットの外部状態として扱われ、状況情報にまとめられている。行動Acが他者Xを対象に他者Yによって行われたものであるとすると、ロボットの外部状態パラメータは、(a)行為者たる他者Yに関する部分と、(b)対象者たる他者Xに関する部分と、(c)他者XとYに関する部分を除く環境部分の3つに分解できる。(a)は行為者Yの表情や行動や態度及び、それらからロボットが推定することのできたこの行為者Yの感情や欲求である。(b)は対象者Xの表情や行動や態度及び、それらからロボットが推定することのできたこの対象者Xの感情や欲求である。また、(c)は例えば周囲の樹木や物体など、他者XとYの双方にとって共通の環境部分である。
【0140】
このとき、行為者Yから見た外部状態パラメータは、前記(b)、(c)に加えて、実際には対象者Xが存在するのだが、これを何らかの他者がいるというように置き換えた記号データから合成される。また、行為者Yの内部状態パラメータは、前記(a)ということになる。
【0141】
そこで、他者行動学習部27は、行動Acの前後の状況を示す状況情報列JiとJdの各々を上記(a)、(b)、(c)に分解して再編成することにより、行動Acの前後の状況を他者の視点から捉えた他者状況情報列Ji'とJd'とし、Ji'を初期状況、Jd'を目的状況、Acを状況遷移行動とする新たな連関情報(他者行動連関情報)R=[Ji',Ac,Jd']を生成して連関データベース部22に追加する。なお、生成された他者行動連関情報Rに類似する連関情報が既に連関データベース部22に記憶されていれば追加しない。なお、この他者行動連関情報Rに類似する連関情報が連関データベース部22に存在するか否かの検索は、目標外行動学習部26で行われた検索と同様である。
【0142】
なお、生成された他者行動連関情報Rに類似する連関情報が既に連関データベース部22に記憶されていれば追加しない。なお、この他者行動連関情報Rに類似する連関情報が連関データベース部22に存在するか否かの検索は、目標外行動学習部26で行われた検索と同様である。
【0143】
この他者行動学習部27によって、ロボットは「他人から学ぶ能力」、すなわち「行動複製能力」を発揮することができる。
【0144】
例えば、泣いている使用者Xの背中を使用者Yがさすることで、泣いていた使用者Xが泣きやみ笑顔を見せた現場を観察することで、ロボットは使用者Yのこのような対人行動を学習することができる。そして、学習したこの行動は別の機会に、泣いている使用者Zを検出したときなどに発現する。
【0145】
このとき、このような対人行動が選択されるには、その行動がロボットの快感情強度Cを増加させるものである必要がある。これには、ロボットが他者に対して抱く好悪感情が関係する。
【0146】
例えば、ロボットがある人物に好感を抱いている時、その人物の窮状は状況入力部21において検知され、このロボットの快感情強度Cを損なうように作用する。そのためロボットは自己の快感情強度Cを改善するために、この人物の窮状を回復する行動を要求され、その結果先に学習された他者の状況改善に効果のあった対人行動が発現する。
【0147】
逆に、ロボットがある人物に好感を抱いていない時、その人物の窮状はロボットの快感情強度Cを損なわないか、増加させるように作用するため、相手の窮状を回復する行動は発現しない、もしくはさらに窮状を増すような行動が発現する。
【0148】
他者に対する好悪感情は、ロボットとその他者とのこれまでの関わり合いを通じて形成される。ロボットを可愛がってくれる人物に対しては、その人物を検知するための辞書情報の中に「この人は良い人」というラベル(情報)が付けられる。逆にロボットをいじめる人物に対しては、その人物を検知するための辞書情報の中に「この人は悪い人」というラベルが付けられる。人物が検知されるたびに、この良い人か悪い人かの判断がなされ、その結果に応じて観測される外部状態がロボットの感情状態に与える影響が変化する。なお、これらの処理は状況入力部21にて行われる。
【0149】
このように、本発明では、他者行動学習部27が、他人の行動を見真似することによって特に対人行動をロボットに獲得させることに貢献し、状況入力部21が検出される他人に対する好悪判断に基づいてロボットの快感情強度Cを変化させ、行動検索部23がその快感情強度Cに基づいて学習された対人行動を発現させる。
【0150】
これまでに述べた構成により、ロボットは「行動探索能力」と「行動複製能力」を発揮することができる。具体的には、(I)行動の発現頻度の適応化、(II)行動の発現条件たる初期状況の新規獲得、(III)行動の効果たる目的状況の新規獲得、(IIII)行動の内容たる状況遷移行動自体の新規獲得、が可能になる。特に、(II)〜(IIII)は従来のロボットでは獲得できない知識である。
【0151】
しかしながら、このような能力だけではロボットは、個々の行動の状況改善効果に縛られてしか行動できないため、一度は状況を悪化させながらも複数の行動を組み合わせることで最終的により改善された状況に到達するという計画性を発揮することができない恐れがある。この点に対しては、以下で説明する状況調節行動学習部28と連鎖行動学習部29とが対応することで、計画性を持った行動をロボットに行わせることができる。
【0152】
(ニ)状況調節行動学習部28
状況調節行動学習部28は、ある初期状況から、ある目的状況に遷移できないときに、他の初期状況からその目的状況へ遷移できた他の連関情報を適用できるようにするために、その初期状況を作り出すための遷移を新たな連関情報(状況調節行動連関情報)として連関データベース部22に記憶させ、ロボットの行動パタンの一つとする動作をする。すなわち、状況調節行動学習部28は、前述の状況調節能力を実現する手段である。
【0153】
状況調節行動学習部28は、連関情報が連関データベース部22に追加される毎に起動し、追加された連関情報R1=[Ji1,Ac1,Jd1]の目的状況Jd1に類似した目的状況Jd2を持つ連関情報R2=[Ji2,Ac2,Jd2](状況類似度Sj(Jd1,Jd2)が所定閾値以上)を連関データベース部22から検索する。検索の結果、連関情報R2が検出されると、状況調節行動学習部28は両者の遷移確率S(R1)とS(R2)を評価して、連関情報R1の遷移確率S(R1)が所定閾値以上あり、連関情報R2の遷移確率S(R2)がS(R1)より所定閾値以上低ければ、R2の初期状況Ji2からR1の初期状況Ji1に至る新たな連関情報(状況調節行動連関情報)R3を生成して連関データベース部22に記憶する動作を行う。あるいは、逆に連関情報R2の遷移確率S(R2)が所定閾値以上あり、連関情報R1の遷移確率S(R1)がS(R2)より所定閾値以上低ければ、R1の初期状況Ji1からR2の初期状況Ji2に至る新たな連関情報(状況調節行動連関情報)R3を生成して連関データベース部22に記憶する動作を行う。
【0154】
なお、生成された状況調節行動連関情報R3に類似する連関情報が既に連関データベース部22に記憶されていれば追加しない。また、この状況調節行動連関情報R3に類似する連関情報が連関データベース部22に存在するか否かの検索は、目標外行動学習部26で行われた検索と同様である。
【0155】
より詳しくは、目的状況Jdがほぼ同一である複数(例えば2つ)の連関情報R1=[Ji1,Ac1,Jd]とR2=[Ji2,Ac2,Jd](いずれか一方が追加された連関情報)のうち、一方の連関情報R1は頻度が高く、他方の連関情報R2は頻度が低いことが、両者の遷移確率を見ることで判断できる。一方が目的状況Jdに到達できるが、他方が到達できないといった原因は、出発点たる初期状況とそのとき行いえる行動の違いにある。そこで、遷移に成功する連関情報R1と成功しない連関情報R2それぞれの初期条件Ji1とJi2を、2つの連関情報に共通に含まれる付帯条件Jkと、前者(成功)に特有の付帯条件Jsと、後者(失敗)に特有の付帯条件Jfに分離する。このJsが成功要因であり、Jfが失敗要因である。Ji1=Jk+Jsであり、Ji2=Jk+Jfである。
【0156】
状況調節行動は、初期状況Ji2=(Jk+Jf)から目的状況Ji1=(Jk+Js)へと状況を遷移させる行動である。
【0157】
例えば、同じ目的状況を持つ下記の2つの連関情報を考える。
【0158】
Figure 0003854061
このとき、「一人でいて寂しい」ことが共通条件Jk、「使用者を見つけて嬉しい」が目標状況、成功要因Jsが「ソファの上にいる」、失敗要因Jfが「ソファの後ろにいる」となる。状況調節行動学習部28が行う処理は、JfをJsにする行動、具体的には「ソファの上に登る」行動Ac3を生成して、この行動Ac3を含んだ新しい連関情報(状況調節行動連関情報)R3=[Ji2=Jk+Jf,Ac3, Ji1=Jk+Js]を組み立てることである。
【0159】
Figure 0003854061
この新たな状況調節行動連関情報R3に従って、ロボットは「ソファの後ろに一人でいて寂しいとき、ソファの上に登る」という行動を行う。なお、ロボットが何かに登ることは、ロボットの行動素片としてメモリ17に記憶されていなければならない。ただ、ソファに登るという行動の持ち合わせがロボットにはなく、無論、「ソファの後ろに一人でいて寂しいとき、ソファの上に登る」という行動パタンもこのとき初めて獲得されるのである。
【0160】
(ホ)連鎖行動学習部29
連鎖行動学習部29は、個々の連関情報(行動)では状況を改善できないとき、複数の連関情報(行動)を連続的に行って状況を改善できる連関情報の連鎖を見つけ、その連鎖を記述した新たな連関情報(連鎖行動連関情報)を生成して連関データベース部22に記憶させ、ロボットの行動パタンの一つとする動作をする。すなわち、連鎖行動学習部29は前述の行動計画能力を実現する手段である。
【0161】
連鎖行動学習部29は、目標外行動学習部26や他者行動学習部27や状況調節行動学習部28の働きにより新たな連関情報が連関データベース部22に追加される毎に起動し、連関データベース部22に記憶される連関情報の内容を調査し、一方の連関情報の目的状況が他方の連関情報の初期状況に類似する、すなわち3つ以上の状況を2つ以上の行動の連鎖で連続的に遷移させる複数の連関情報R1=[Ji1,Ac1,Jd1]、R2=[Ji2,Ac2,Jd2](状況類似度Sj(Jd1,Ji2)が所定閾値以上)、R3=[Ji3,Ac3,Jd3](状況類似度Sj(Jd2,Ji3)が所定閾値以上)…Rn=[Jin,Acn,Jdn]から成る連鎖を全て検索する(ただしnは4以上の自然数)。ここで連関情報R1は第1の連関情報であり、R2は第2の連関情報であり、R3は第3の連関情報であり、この場合には2連鎖となる。連鎖は、それを構成する要素たる連関情報が一つでも異なれば異なる連鎖であり、また要素たる連関情報の順序が一個所でも異なれば異なる連鎖である。なお、この検索は、追加された連関情報が上記R1〜Rnのいずれかとなる連鎖の検索に限定される。検索の結果、連鎖が検出されると、連鎖行動学習部29は、この抽出された連鎖の中で、連関情報Rk(1≦k<n)の初期状況Jikの快感情強度C(Jik)よりも、連関情報Rp(k<p≦n)の目的状況Jdpの快感情強度C(Jdp)が改善されている部分連鎖(前記連鎖そのものも含む)を全て抽出し、その各々を新たな連関情報(連鎖行動連関情報)Rx=[Jik,Ack+…+Acp,Jdp]として連関データベース部22に記憶する。
【0162】
なお、生成された連鎖行動連関情報Rxに類似する連関情報が既に連関データベース部22に記憶されていれば追加しない。また、この連鎖行動連関情報Rxに類似する連関情報が連関データベース部22に存在するか否かの検索は、目標外行動学習部26で行われた検索と同様である。
【0163】
さらに、この連鎖行動連関情報から、上述した手順によって更に新たな連鎖行動連関情報を作成し記憶していくことも可能である。
【0164】
また、上記処理により、ある連関情報R10の目的状況Jd10と類似する初期状況Ji11を有した連関情報R11と、この連関情報R11の目的状況Jd11と類似する初期状況Ji12を有する連関情報R12と、この連関情報R12の目的状況Jd12と類似する初期状況Ji13を有する連関情報R13とが存在する場合、連関情報R10の初期状況Ji10に対してR11,R12の目的状況Jd11,Jd12の快感情強度Cが低くても、連関情報R13の目的状況Jd13の快感情強度Cが大きければ、この連関情報R10〜R13は新たな連鎖行動連関情報として連関データベース部22に記憶される。この場合の連鎖は2(n=2)であり、連関情報は3個(n+1)である。
【0165】
このように、複数の連関情報を組み合わせて連鎖行動連関情報を生成する場合には、途中の行動を実行したときには快感情強度Cが一時的に低下しても最終的に快感情強度Cが増加していれば良いものとする。
【0166】
このような構成により、ロボットは、状況調整能力と行動計画能力を発揮する。具体的には、直接的に状況を改善する行動だけでなく、直接状況を改善しなくとも間接的に状況の改善に結びつく準備行動の獲得と、途中で状況を悪化させても最終的には状況改善に結びつける一連の行動を記した連関情報の生成・獲得が可能になる。
【0167】
なお、既に述べた通り、状況調節行動学習部28と連鎖行動学習部29は、連関情報データベース部22に記憶された連関情報の更新状況を監視しており、システム起動時に起動されるほかに、新たな連関情報の追加を検出する毎に起動される。また、自身によって連関情報の追加が一通り行われた直後にも再び起動されて、追加すべき連関情報が見出せなくなるまで再帰的に起動される。
【0168】
以上述べた様な構成と、各構成要素が実行する能力について説明してきたが、続いて、図4の行動形成方法のフローチャートを参照して行動形成方法について説明する。なお、連関データベース部22には、ロボット運用時点で、個々の連関情報との他に、その状況調節行動連関情報と連鎖行動連関情報とが既に記憶されているものとする。もし、そうでなければ、ロボット運用以前の段階で、状況調節行動学習部28と連鎖行動学習部29とが起動され、その働きにより全ての連関情報についての状況調節行動連関情報と連鎖行動連関情報が追加されるものとする。
【0169】
(1)状況入力部21がロボット周囲の状況情報を取得する(S1)。なお状況情報は、距離センサ11、感圧センサ14、撮像カメラ10、マイク12により検知された、例えば被検出体(使用者等)の有無、被検出体の表情や状態、被検出体等が発する音、被検出体による行動である。検知された状況情報はそれまでに得られていた状況情報列に編集され、行動発現ループ、学習ループ1、学習ループ2、学習ループ3のそれぞれに出力される。
【0170】
まず、行動発現ループについて説明する。
【0171】
(2)行動検索部23が、最新の状況情報列(現在状況Jic)に適合する初期状況を持つ連関情報(候補連関情報)をメモリ17内に記憶される連関データベース部22から抽出する(S2)。この抽出の際には、各連関情報の状況適合度Aが計算されて評価され、所定閾値以上を獲得した連関情報のみが候補連関情報として抽出される。このとき、候補連関情報の状況改善効果E、遷移確率S、実行容易度Wを含むスコア情報Sc(R)も一緒に抽出される。抽出された候補連関情報はスコア情報とともに一時的にメモリ17に記憶される。
【0172】
(3)次に、入力された状況情報Jicに適合する連関情報(候補連関情報)が抽出されたか否かがCPU16にて判断される(S3)。
【0173】
候補連関情報が少なくとも一つ以上抽出された場合にはS4へ進み、候補連関情報が全く抽出されなかった場合には、行動探索を行うために連関データベース部22からランダムに一つの連関情報を解連関情報として選択してS5に進む。
【0174】
(4)候補連関情報が少なくとも一つ以上抽出された場合には、抽出された各候補連関情報から解連関情報が決定される(S4)。
【0175】
各候補連関情報の状況改善期待度Ep=状況改善効果E×遷移確率S×実行容易度Wが計算され、所定閾値以上の値を有するか否かがCPU16にて判断される。判断の結果、状況改善期待度が所定閾値に満たない候補連関情報はメモリ17の一時記憶から消去される。そして、残った候補連関情報の中で最大の状況改善期待度を持つものを解連関情報としてS5に進む。もし、残った候補連関情報がない場合には、行動探索を行うために連関データベース部22からランダムに一つの連関情報を解連関情報として選択してS5に進む。
【0176】
(5)次に、CPU16は解連関情報の行動情報に記述されるタイミング情報に従って、行動出力部24に行動情報に記述される行動素片情報を出力する(S5)。
【0177】
行動出力部24は、受け取った行動素片情報に従って動作を開始する。なお動作とは、ロボットが駆動されることであり、例えばLED(9)が点滅したり、スピーカ13から音が発せられたり、ロボット1自体が移動したり変形したりする等である。
【0178】
解連関情報が実行された後は、S1に戻る。
【0179】
続いて、学習ループ1(信頼性学習部25、目標外行動学習部26)について説明する。
【0180】
(6)まず、行動検索部23から行動出力部24に出力された解連関情報に従って動作を行っているか否かがCPU16にて判断される(S6)。
【0181】
行っている場合にはS7に進み、行っていない場合にはS1へ戻る。S1へ戻る場合には、ロボットが何ら動作を行っていない状態である。
【0182】
(7)ロボットが動作を行っている場合には、解連関情報に従った動作が終了しているか否かがCPU16にて判断される(S7)。
【0183】
終了している場合にはS8へ進み、終了していない場合にはS1へ戻る。S1へ戻る場合には、ロボットが動作中である。
【0184】
(8)動作が終了している場合には、CPU16が、解連関情報に記述された目的状況Jdと実際の動作後の状況Jdcとの遷移達成度B(Jdc,Jd)を計算し、目的状況Jdに達したか否かを判断する(S8)。遷移達成度B(Jdc,Jd)が所定閾値以上であれば選択された解連関情報による遷移は成功したとみなし、所定閾値未満であれば失敗したとして、遷移確率情報Siの内容を適宜更新していく。このような動作を行うことで解連関情報に対して信頼性学習を行っていく。
【0185】
(9)次に、S8で失敗したとみなされた場合には、CPU16が、解連関情報の目的状況と異なる状況に遷移が行われたとみなして、解連関情報の初期状況と目的状況を実際の状況 (スコア情報Sc含む)に置き換えた新たな連関情報(目標外行動連関情報)がCPU16によって生成される(S9)。この生成された連関情報は、同様の連関情報が連関データベース部22に存在していなければ記憶される。
【0186】
S1へ戻る。
【0187】
続いて、学習ループ2(他者行動学習部27)について説明する。
【0188】
(10)まず、状況入力部21によって、被検出体(特に使用者)が何らかの行動をおこしているか否かが検知される(S10)。
【0189】
被検出体の行動が検知できた場合にはS11へ進み、検知できなかった場合にはS1へ進む。S1へ進む場合には、被検出体が検知範囲に存在しない、被検出体が行動を行っていない、または被検出体は行動を行っているがロボットがこの行動を認識できない、のいずれかの状態である。
【0190】
(11)検知できた場合には、状況入力部21で検知された状況情報列をもとに被検出体の行動が終了しているか否かがCPU16によって判断される(S11)。
【0191】
行動が終了している場合にはS12へ進み、終了していない場合にはS1へ進む。S1へ進む場合には、被検出体の行動が終了するまでロボットが、この被検出体の行動を検知しつづける。
【0192】
(12)行動が終了した場合には、CPU16は、被検出体の初期状況Jiと、これに続いて行われた状況遷移行動Acと、状況遷移行動Acによって達成された目的状況Jdとを状況情報列から抽出し、これらを一組の連関情報(他者行動連関情報)として編集する(S12)。この編集された連関情報は、同様の連関情報が連関データベース部22に存在していなければ記憶される。
【0193】
学習ループ2により、ロボットは、被検出体の行動を自分の新たな動作パタンとして取り込むことができる。S1へ進む。
【0194】
続いて、学習ループ3(状況調節行動学習部28、連鎖行動学習部29)について説明する。
【0195】
(13)まず、連関データベース部22に新たに追加された連関情報があるか否かがCPU16により調べられる(S13)。
【0196】
新たな連関情報が存在する場合にはS14に進み、存在しない場合にはS1へ進む。
【0197】
新たな連関情報を検出するには、前回検知した時点での連関情報の個数をメモリ17に記憶させておき、この数値と今回検知した時点での連関情報の個数を比較して判断する方法や、前回検知した時点での連関情報全てのインデックス(R0001などの識別記号)をメモリ17に記憶させておき、この連関情報と今回検知した時点でのインデックスとを一つ一つ比較して判断する方法がある。
【0198】
(14)システム起動時点、あるいは新たな連関情報が追加されていた場合には、状況調節行動学習部28によって、新たに追加された連関情報に基づいた新たな連関情報(状況調節行動連関情報)が生成され、同様の連関情報が連関データベース部22に存在していなければ記憶される (S14)。
【0199】
(15)次に、連鎖行動学習部29にて、新たに追加された連関情報に基づいた新たな連関情報(連鎖行動連関情報)が生成され、同様の連関情報が連関データベース部22に存在していなければ記憶される(S15)。S1へ進む。
【0200】
このような(1)〜(15)の工程により、ロボットの行動が形成され/動作されていく。
【0201】
具体的には、上述した1.行動探索能力により、ロボットが有効な行動を知らない場合にいくつかの知っている行動を試してその新たな効果を発見して学習したり、2.行動複製能力により、他者の行動を観察することにより新たな行動の存在を発見して学習したり、3.状況調整能力により、対処できない状況を対処可能な状況に変える行動を発見して学習したり、4.行動計画能力により、これまで別々の行動として知っていた複数の行動を連続して実行することの新たな効果を発見して学習したりという4つの学習をほぼ並列処理して行って動作パタンを増やしていく。
【0202】
以上述べたような第1の実施の形態では、動作パタンとその活用法を時間の経過と共にロボット自体が自律的に学習し増加させていくことで、使用者の興味を薄れさせることなく継続して使用される。また、ロボットが行う行動が次第に的確かつ高度になり、使用者はロボットが成長していくことを実感できる。
【0203】
また、従来のように特定の入力に対して略単一の動作を行うこともない。
【0204】
また、使用者が新たに動作パタンを入力/記憶させる必要がなく、操作性を向上させると共に、時間の経過と共に生物に限りなく近いロボットにすることができる。
【0205】
また、行動パタンを被検出体から学ぶことで、自己の行動経験の範囲を超えた新しい行動を学習し自らの行動パタンの一つとすることができる。
【0206】
また、行動の成功要因と失敗要因を抽出し、失敗要因を取り除き成功要因を取り込むような連関情報を形成するため、経験を積むほどにより高い成功率で状況に対処することができる。
【0207】
また、複数の行動パタンを組み合わせて、一連の行動パタンとすることで、個別の行動では達成できなかった状況に至らせることが可能となる。
【0208】
また、ロボットの行動面における学習成長能力を従来にない高いレベルで実現し、使用者にとって使用する(育て)甲斐のある、より飽きのこないロボットを提供することができる。
【0209】
次に、本発明に係る疑似生物システムをロボットにて実施した第2の実施形態の構成について図5を参照して説明する。
【0210】
なお、以下の各実施の形態において同一構成要素は同一符号を付し重複する説明は省略する。
【0211】
第2の実施形態の特徴は、ロボットを動作するプログラムを記憶したコンピュータ読み取り可能な記憶媒体を使ったロボットの行動形成方法である。
【0212】
図5は第2の実施の形態を説明するためのブロック図であり、記憶媒体60は上記第1の実施の形態が実施されるプログラムが記憶されている。
【0213】
(1)記憶媒体60内のプログラムは、電子機器なるパソコン61によって読み取られてメモリ62に記憶され、無線通信でこの読み取られたプログラムをロボット1に送信し、ロボット1内の制御部15内のメモリ17に記憶させる。
【0214】
この場合にはパソコン61は、記憶媒体60が挿入される挿入部63、読み取り/記憶/演算動作をつかさどるCPU64、読み取られたプログラムを記憶するメモリ62、読み取られたプログラムをロボット1に送信する送信部65、キーボードやマウスなどの入力部66が設けられる。またロボット1には送信された動作信号を受信する受信部67が外装の一部分に設けられ、受信部67で受信された動作信号は制御部15内のメモリ17に記憶されて動作を開始する。
【0215】
(2)またロボット1に設けられたプログラム読み取り部68に記憶媒体を挿入して直接ロボット1内の制御部15内のメモリ17にプログラムを記憶させて動作させることもできる。
【0216】
このように(1)、(2)によってロボット1内のメモリ17にプログラムが記憶された後は上述した第1の実施の形態と同様の動作を行う。
【0217】
このような第2の実施の形態では、同一のロボットで記憶されるプログラムの種類を変えることができ、例えば活動的なロボット用プログラムであればよく鳴きよく走るなどの活動的な動作を積極的に行うような、また甘えん坊なロボット用プログラムであれば使用者に甘えるような仕草と鳴き声を積極的に行うようなロボットになって、使用者が好むロボットを実現することができる。したがってロボットは1体購入するだけでよく、プログラムの種類を変えるだけで使用者は複数の楽しみを得ることができる。
【0218】
なお、本発明は、上述した各実施の形態には限定されず、その主旨を逸脱しない範囲で種々変形して実施できることは言うまでもない。例えば、ロボットの可動部もしくは本体に、ロボット周囲の温度を測定する温度センサを設けることも可能である。このようにすることで、ロボットは外部状況として周囲温度も扱うことができるようになる。
【0219】
なお、本発明における記憶媒体としては、磁気ディスク、フロッピーディスク、ハードディスク、光ディスク(CD−ROM,CD−R,DVD等)、光磁気ディスク(MO等)、半導体メモリ等、コンピュータプログラムを記憶でき、かつコンピュータが読み取り可能な記憶媒体であれば、その記憶形式と物理媒体の種類は何れの形態であってもよい。
【0220】
また、記憶媒体からコンピュータにインストールされたコンピュータプログラムの指示に基づきコンピュータ上で稼動しているOS(オペレーションシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施の形態を実現するための各処理の一部を実行してもよい。
【0221】
さらに、本発明における記憶媒体は、コンピュータと独立した媒体に限らず、LANやインターネット等により伝送することを目的としてコンピュータプログラムを記憶または一時記憶した記憶媒体や、LANやインターネット等により伝送されたコンピュータプログラムをダウンロードして記憶または一時記憶した記憶媒体も含まれる。
【0222】
また、記憶媒体は1つに限らず、複数の媒体から本実施形態における処理が実行される場合も、本発明における記憶媒体に含まれ、媒体の構成は何れの構成であってもよい。
【0223】
なお、本発明におけるコンピュータは、記憶媒体に記憶されたプログラムに基づき、本実施の形態における各処理を実行するものであって、パソコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。
【0224】
また、本発明におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本発明の機能を実現することが可能な機器、装置を総称している。
【0225】
また、行動形成方法はコンピュータプログラムとして記憶されている。
【0226】
また、本発明に係る疑似生物システムには、実体としてのロボットのほかに、擬人的あるいは擬生物的なキャラクタをCG(Computer Graphics)などの技術によりアニメーション化してコンピュータなどの表示画面上に仮想的に実体化させるソフトウェアアプリケーションも含まれる。この場合、行動出力部(24)はロボット(1)のモータを制御して各関節を所望の角度に運動させる代わりに、座標変換によってキャラクタの各関節を所望の角度に運動させたアニメーションを表示画面上に表示する。システムの実体がロボットではなくコンピュータなどであるため、実際のロボットと比較して取得可能な状況情報や実行可能な行動に若干の制約があるものの、本発明による行動形成方法を実行することが可能である。
【0227】
また、目標外行動学習部に入力される情報は、状況入力部から直接入力される状況情報であっても、信頼性学習部から入力される情報(不成立連関情報)のいずれであっても構わない。
【0228】
【発明の効果】
以上述べた様な本発明によれば、疑似生物自体が新たな動作パタンを作成し追加していくことで、使用者に飽きのこない疑似生物となる。
【図面の簡単な説明】
【図1】 本発明に係る疑似生物をロボットにて実施した第1の実施形態の斜視図。
【図2】 本発明に係る疑似生物をロボットにて実施した第1の実施形態のブロック線図。
【図3】 本発明に係る疑似生物をロボットにて実施した第1の実施形態の動作を説明するためのブロック線図。
【図4】 本発明に係る疑似生物をロボットにて実施した第1の実施形態の行動形成方法を説明するためのフローチャート。
【図5】 本発明に係る疑似生物をロボットにて実施した第2の実施形態を説明するためのブロック線図。
【符号の説明】
1 ロボット
2 頭部
3 右腕部
4 左腕部
5 右足部
6 左足部
7 しっぽ
8 胴体部
9 LED
10 撮像カメラ
11 静電容量式距離センサ
12 マイク
13 スピーカ
14 感圧センサ
15 制御部
16 CPU
17 メモリ
21 状況入力部
22 連関データベース部
23 行動検索部
24 行動出力部
25 信頼性学習部
26 目標外行動学習部
27 他者構造学習部
28 状況調節行動学習部
29 連鎖行動学習部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a simulated biological apparatus, a simulated biological behavior forming method in a simulated biological apparatus, and a computer-readable storage medium describing a program for performing simulated biological behavior formation.
[0002]
[Prior art]
In recent years, various software applications in which characters appear on a display screen of a computer and robots with character characteristics that exist as entities have been put on the market.
[0003]
As an example implemented as a software application for a personal computer, “TEO (named“ Theo ”: registered trademark: Fujitsu)” in which a bird-like character such as a dolphin appears is famous, and it has become independent. As an example implemented as a robot, a dog-shaped robot “AIBO (registered trademark: Sony)” with a metallic design is famous. A well-known example of a semi-autonomous robot remotely controlled from an external computer is the wheeled robot “R100 (NEC)” with an owl-like face.
[0004]
These software applications and robots are systems that aim to make a character given as a model act as if it is alive. Therefore, the system is configured to output a response such as the character's emotional expression and behavior according to input information from the user.
[0005]
Recently, some of these software applications and robots have the capability of recognizing pattern information such as user's face image and voice waveform, and advanced so that such pattern recognition result can be responded as input information. It is becoming. Such a system is a so-called pseudo biological system (or virtual biological system) that attempts to give a pseudo life to the character (not necessarily a living creature) that is to be produced.
[0006]
The simulated biological system recognizes the environment surrounding the computer or robot that is the system's entity, including the actions performed by the user of the system, and responds to the state inside the simulated organism that changes according to the recognition result of the surrounding environment. The system is designed to return a predetermined response. For example, if a user bites off, a pseudo-living creature expresses joy, and if it fiddles, it becomes angry or angry. In this way, pseudo-biology with interactivity at the level of emotions and desires has only tasteless dry interactivity to perform practical tasks.For example, unlike a word processor software or an industrial robot, Widely accepted by both men and women because it brings healing effects and the interest of the user is interested in the user, or the user is happy to own such a sophisticated robot with character characteristics It is being
[0007]
By the way, in the method of determining the behavior of such a pseudo organism, the following three methods have been implemented so far, and the conventional pseudo organism system has been operated by one of these methods: .
I, selective execution method
II, small dispensing method
III, reinforcement learning method
First, I is a method adopted by most of the simulated biological systems sold as toys, and is input to the system from a plurality of action patterns stored in advance in a storage unit built in the system. This is an action expression method in which one action corresponding to the received signal is selected and executed. What kind of signal should be inputted and what kind of action should be taken are built in the system in advance, and the correspondence (action pattern) between the input (situation) and action brings responsiveness like a creature. It is something that is built.
[0008]
The signal input to the system is a signal from an optical sensor or a pressure sensor provided in a computer or robot that is the actual system, and the user passes or passes through the optical sensor included in the system. A predetermined signal is input when the user strokes the pressure sensor. For example, when a user passes in front of an optical sensor, a simulated creature calls the user if it is a software application, or if the robot is a robot, the robot starts to walk toward the user. When a user strokes the pressure sensor, the pseudo creature will make a sound and it is a combination of the input that triggers the action and the action of the pseudo creature that is performed on it. is there.
[0009]
However, in such I, since a specific action pattern for a certain input signal is selected and the selected action pattern is executed by the pseudo-living creature, the same action is repeated every time if the situation is the same. . Therefore, the more you use it, the more you learn the behavior pattern of the simulated creature, sometimes you can predict the next action, or you will get tired of the simulated creature and you will not feel like a creature and it will be unpleasant There was a problem such as. In addition, mimetic creatures are only programmed to take a certain action for a certain situation, and they do not know at all what kind of situation will result from that action, and will react extremely momentarily. There was also the problem that it could only be done.
[0010]
As a development type of I, there is a method of preparing a plurality of specific action patterns for a certain input signal without being limited to one, and determining one on the spot by a random number, but it is prepared in advance. In the limited options, the same problem occurred because there was no change in acting without considering the result.
[0011]
Next, II is a method adopted by a pseudo-living system that emits words, such as a pseudo-living creature that emits words "Farby (registered trademark: Tiger Electronics Limited)", and is stored in advance in a storage unit built in the system. The point that the action pattern corresponding to the signal input to the system is selected and executed from among the plurality of action patterns is the same as I.
[0012]
However, the action pattern stored here is added with time information indicating the onset time and information on the amount of input, and the elapsed time since the system was first started and the amount of input given. It is a behavior expression method in which the behavior pattern selected together with the behavior pattern changes as needed. For example, from the start up to 100 hours, there are three types of behavior patterns A, B, and C that can be expressed for signals input to the system, one of which is executed according to the input signal, and 100 There are 8 types of action patterns from C to J up to 1000 hours, one of which is executed, and after 1000 hours, there are action patterns C, F, G, J to Z, one of these Is executed. By doing so, the mimetic creature changes its behavior pattern according to the passage of time and the amount received, that is, it seems to grow from the user.
[0013]
However, II is different from I in that the action pattern that can be selected changes depending on the elapsed time and the input amount, but the action can be taken without considering the result in the limited options prepared in advance. This is exactly the same as I. Therefore, II had the same problem as I.
[0014]
Next, III is a method with learning that is adopted to give the individual creatures individuality and to further refine their behavior, and a plurality of pre-stored in the storage unit built in the system This is an action expression method in which an expression frequency parameter is added to each of the action patterns, and an action pattern having a higher expression frequency is selected more frequently in a situation corresponding to the action pattern.
[0015]
At this time, there are a plurality of action patterns that can be selected for one input signal, and depending on how the user reacts when an action selected from the plurality of action patterns is performed. The frequency of the behavior changes.
[0016]
For example, if there is a reaction (when the input to the pressure sensor is large in a short time) that the user hits the pseudo creature after the action, the pseudo creature has been “struck” for the action that has just been performed. Determine and reduce the frequency of this behavior. On the other hand, if the user responds by stroking the simulated creature (if the input to the pressure sensor is small for a long time), the simulated creature is judged to have been praised for the action taken. Increase the frequency of this behavior.
[0017]
In this way, the user is praised or scolded for the behavior taken by the mimetic creature, so that the user can act well for the artificial creature that is an artificial life in the same way as when interacting with dogs and cats. And can teach bad behavior. In this way, learning performed by giving only an evaluation of whether the result is good or bad is called reinforcement learning. Reinforcement learning that increases or decreases the frequency of behavioral behavior, the pseudo-living creatures that initially performed regardless of the praised or praised behavior only perform the praised behavior as learning progresses, and no longer be praised To go. And since the selectivity of such behavior patterns differs for each pseudo-living creature depending on how the user has struck, it is possible to create the personality of the pseudo-living creature.
[0018]
However, although the personality of the pseudo-biology is formed by reinforcement learning, it is still the same that the behavior can be selected only from the limited options prepared in advance, and learning reaches the peak under the restrictions. In the case of moths, only familiar behaviors with high frequency of occurrence appear, so the problem of getting bored by the user is the same as I and II.
[0019]
As described above, I to III are selected from the limited behavior patterns that are preset (stored) as suitable for the situation when the mimetic creatures act. Users will be able to predict the behavior patterns of simulated organisms and lose interest in the simulated organisms, and the reaction of the simulated organisms will become a single, so it is no longer considered to be a category of toys. There was a problem such as.
[0020]
Also, even if you can personalize, considering that the selected action is one of the stored behavior patterns, it is an individualization that can be determined only by whether the selection range is large or small However, it does not increase the behavior pattern beyond the preset category, and does not act in a situation exceeding the preset category. Some people were not satisfied.
[0021]
[Problems to be solved by the invention]
As described above, since the behavior pattern to be executed is selected from the pre-stored behavior of the conventional simulated creature, the behavior of the simulated creature becomes predictable and less interested as the user uses the simulated creature. There was a problem.
[0022]
Therefore, the present invention has been made in view of the above-described conventional problems, and a pseudo-biological system and a pseudo-biological apparatus in which a user can continuously use a pseudo-biology by autonomously increasing a behavior pattern with the passage of time. It is an object of the present invention to provide a computer-readable storage medium that describes a behavior forming method of a simulated organism and a program for performing the behavior formation of a simulated organism.
[0023]
[Means for Solving the Problems]
  In order to achieve the above object, a simulated biological apparatus according to the present invention is a simulated biological apparatus that realizes a simulated biological creature that moves according to a desired motion pattern. An external situation input means for detecting as a parameter value, an internal situation holding means for holding the pseudo-animated emotion as an internal parameter value, and the operation patternThe action to be performed by the mimetic creature, which is realized in combination, and the external parameter value and the internal parameter value of the mimetic creature before the action, and the mimetic creature after the action representing the situation before and after the transition An external parameter value and an internal parameter value, and a transition probability representing how much the transition by the action is established;As a set of linkage information consisting of a plurality of linkage database means for storing,The similarity between the current external parameter value and internal parameter value of the simulated creature, the external parameter value and internal parameter value of the simulated creature before the action stored in the association database means, and the transition probability of the action Based on the association database means, the association information for instructing the behavior to be performed by the simulated creatureBased on the action retrieval means to be selected and the selected association informationLet the simulated creature actA pseudo-biological device having action output means, provided inside the pseudo-biological device,Action based on the selected linkage informationThe external parameter value detected after and the internal parameter value held, and the selected association informationAfter actionWhen the similarity between the external parameter value and the internal parameter value is calculated and the similarity is equal to or greater than a predetermined value, the transition probability of the selected association information is increased, and the similarity is less than the predetermined value. If there is, reliability learning means for reducing the transition probability of the selected association informationIt is characterized by comprising.
The simulated biological apparatus according to the present invention is a simulated biological apparatus that realizes a simulated biological object that moves according to a desired motion pattern, and detects the situation around the simulated biological object as an external parameter value inside the simulated biological apparatus. An external situation input means, an internal situation holding means for holding a pseudo emotion of the simulated creature as an internal parameter value, an action to be performed by the simulated creature realized by combining the action patterns, and transition by the action Represents the situation before and after, the external parameter value and internal parameter value of the simulated creature before the action, the external parameter value and internal parameter value of the simulated creature after the action, and the probability that the transition by the action is established As a set of linkage information consisting of transition probabilities indicating whether or not Based on the external parameter value and internal parameter value of the simulated organism, the similarity between the external parameter value and internal parameter value of the simulated organism before the action stored in the association database means, and the transition probability of the behavior, A simulated biological apparatus, comprising behavior search means for selecting association information for instructing behavior to be performed by the simulated creature from the association database means, and behavior output means for causing the simulated creature to act based on the selected linkage information. In the pseudo-biological device, the external parameter value detected after acting based on the selected association information and the retained internal parameter value, and the behavior of the selected association information When the similarity between the subsequent external parameter value and the internal parameter value is calculated, and the similarity is less than a predetermined value, The external parameter value and the internal parameter value before acting based on the selected association information, the behavior of the selected association information, the external parameter value and the internal parameter value after the behavior of the simulated creature, Associating information is generated as a set of transition probabilities indicating that the trial has succeeded once, and if the generated associating information is not stored in the associating database means, it is stored as the associating information. It is characterized by having a non-target behavior learning means.
The simulated biological apparatus according to the present invention is a simulated biological apparatus that realizes a simulated biological object that moves according to a desired motion pattern, and detects the situation around the simulated biological object as an external parameter value inside the simulated biological apparatus. An external situation input means, an internal situation holding means for holding a pseudo emotion of the simulated creature as an internal parameter value, an action to be performed by the simulated creature realized by combining the action patterns, and transition by the action Representing the situation before and after, the external and internal parameter values of the simulated organism before the action and the simulated life after the action As a set of association information consisting of external parameter values and internal parameter values of an object, a plurality of association database means for storing, external parameter values and internal parameter values of the present artificial creature, and the association database means are stored. Based on the similarity between the external parameter value and the internal parameter value of the simulated organism before the behavior, the behavior search unit that selects the association information for instructing the behavior to be performed by the simulated organism from the association database unit, A behavior output means for causing the simulated creature to act based on the selected association information, and recognizes the behavior of the detected object from the external parameter value detected by the external situation input means, and the detection The external parameter value to be detected is decomposed into a part related to the detected object and an environment part excluding the detected object. Using the dictionary information storing information for specifying the internal parameter value of the detected object based on the detected external parameter value using the environmental part as the external parameter value of the detected object, the recognized action The internal parameter value of the detected object is estimated from the external parameter values detected before and after the detected action, the external parameter value of the detected object detected before and after the action, and the action The internal parameter value of the detected object estimated from the external parameter values detected before and after using the dictionary information is generated as a set of association information, and the generated association information is stored in the association database means. It is characterized by comprising other person behavior learning means for storing if it is not stored.
The simulated biological apparatus according to the present invention is a simulated biological apparatus that realizes a simulated biological object that moves according to a desired motion pattern, and detects the situation around the simulated biological object as an external parameter value inside the simulated biological apparatus. An external situation input means, an internal situation holding means for holding a pseudo emotion of the simulated creature as an internal parameter value, an action to be performed by the simulated creature realized by combining the action patterns, and transition by the action Represents the situation before and after, the external parameter value and internal parameter value of the simulated creature before the action, the external parameter value and internal parameter value of the simulated creature after the action, and the probability that the transition by the action is established As a set of linkage information consisting of transition probabilities indicating whether or not Based on the external parameter value and internal parameter value of the simulated organism, the similarity between the external parameter value and internal parameter value of the simulated organism before the action stored in the association database means, and the transition probability of the behavior, A simulated biological apparatus, comprising behavior search means for selecting association information for instructing behavior to be performed by the simulated creature from the association database means, and behavior output means for causing the simulated creature to act based on the selected linkage information. In the above, the plurality of pieces of association information having the parameter values that are substantially the same as the external parameter values after the action and the internal parameter values are extracted from the association information stored in the association database means, and the extracted association information Among these, the external before the action of the association information that is lower than the other association information from which the transition probability is extracted The parameter value and the internal parameter value are set as the first parameter value, and the other external parameter value and the internal parameter value before the action of the other association information are set as the second parameter value, the first parameter value, The action of changing the first parameter value to the second parameter value, the second parameter value, and the transition probability set to a predetermined initial value are generated as a set of association information, and this generation If the associated information is not stored in the association database means, a situation adjustment action learning means for storing the association information is provided.
The simulated biological apparatus according to the present invention is a simulated biological apparatus that realizes a simulated biological object that moves according to a desired motion pattern, and detects the situation around the simulated biological object as an external parameter value inside the simulated biological apparatus. An external situation input means, an internal situation holding means for holding a pseudo emotion having at least the pleasant feeling of the pseudo organism as an internal parameter value, and an action to be performed by the pseudo organism realized by combining the operation patterns; A set of associations consisting of the external parameter value and internal parameter value of the simulated organism before the behavior and the external parameter value and internal parameter value of the simulated organism after the behavior, which represent the situation before and after transition by the behavior. A plurality of associative database means for storing information, and external parameter values and internal parameters of the present simulated organism Based on the similarity between the external parameter value and the internal parameter value of the pre-behavior stored before the action stored in the association database means, the association database means indicates the association information indicating the action to be performed by the pseudo-living creature. Action to choose from In the simulated biological apparatus having search means and behavior output means for causing the simulated creature to act based on the selected linkage information, the first linkage information among the linkage information stored in the linkage database means And second association information having the external parameter value and the internal parameter value of the simulated organism before the action, which substantially match the external parameter value and the internal parameter value of the simulated organism after the behavior of the first association information, , And the pleasant emotion in the external parameter value and internal parameter value of the simulated organism before the action of the first linkage information is the external parameter value of the simulated organism after the behavior of the second linkage information and When the internal parameter value is lower than the pleasant feeling, the external parameter value and the internal parameter value of the pseudo creature before the action of the first linkage information A behavior from the first linkage information to the second linkage information, and an external parameter value and an internal parameter value of the pseudo creature after the behavior of the second linkage information are generated as a set of linkage information. If the generated association information is not stored in the association database unit, a chain action learning unit for storing the association information as association information is provided.
The simulated biological apparatus according to the present invention is a simulated biological apparatus that realizes a simulated biological object that moves according to a desired motion pattern, and detects the situation around the simulated biological object as an external parameter value inside the simulated biological apparatus. An external situation input means, an internal situation holding means for holding a pseudo emotion having at least the pleasant feeling of the pseudo organism as an internal parameter value, and an action to be performed by the pseudo organism realized by combining the operation patterns; A set of associations consisting of the external parameter value and internal parameter value of the simulated organism before the behavior and the external parameter value and internal parameter value of the simulated organism after the behavior, which represent the situation before and after transition by the behavior. A plurality of associative database means for storing information, and external parameter values and internal parameters of the present simulated organism Based on the similarity between the external parameter value and the internal parameter value of the pre-behavior stored before the action stored in the association database means, the association database means indicates the association information indicating the action to be performed by the pseudo-living creature. In the simulated biological apparatus, the behavior search means for selecting from the above, and the behavior output means for causing the simulated creature to act based on the selected linkage information, among the linkage information stored in the linkage database means, A second link having external parameter values and internal parameter values of the pre-behavior substantially matching the external parameter values and internal parameter values of the pseudo-biology after the action of the first link information; Is substantially the same as the external parameter value and the internal parameter value of the simulated creature after the action of the second link information. And extracting third parameter information having an external parameter value and an internal parameter value of the simulated creature before the action, and performing the pleasure in the external parameter value and the internal parameter value of the simulated creature before the action of the first link information. When the emotion is lower than the pleasant emotion in the external parameter value and the internal parameter value of the pseudo organism after the action of the third linkage information, the external parameter value of the pseudo organism before the action of the first linkage information And the internal parameter value, the action from the first linkage information to the second linkage information, the action from the second linkage information to the third linkage information, and the action after the third linkage information An external parameter value and an internal parameter value of the simulated organism are generated as a set of association information, and the generated association information is not stored in the association database means. If there is, it is characterized by having a chain action learning means for storing it as association information.
The simulated biological apparatus according to the present invention is a simulated biological apparatus that realizes a simulated biological object that moves according to a desired motion pattern, and detects the situation around the simulated biological object as an external parameter value inside the simulated biological apparatus. An external situation input means, an internal situation holding means for holding a pseudo emotion having at least the pleasant feeling of the pseudo organism as an internal parameter value, and an action to be performed by the pseudo organism realized by combining the operation patterns; A set of associations consisting of the external parameter value and internal parameter value of the simulated organism before the behavior and the external parameter value and internal parameter value of the simulated organism after the behavior, which represent the situation before and after transition by the behavior. A plurality of associative database means for storing information, and external parameter values and internal parameters of the present simulated organism Based on the similarity between the external parameter value and the internal parameter value of the pre-behavior stored before the action stored in the association database means, the association database means indicates the association information indicating the action to be performed by the pseudo-living creature. Action to choose from In the simulated biological apparatus having search means and behavior output means for causing the simulated creature to act based on the selected linkage information, the first linkage information among the linkage information stored in the linkage database means And second association information having the external parameter value and the internal parameter value of the simulated organism before the action, which substantially match the external parameter value and the internal parameter value of the simulated organism after the behavior of the first association information, N (where n is a natural number greater than or equal to 2), (n + 1) linkage information is extracted, and the external parameter value and the internal parameter value of the simulated organism before the action of the first linkage information The pleasant emotion in the nth chain is the pleasant emotion in the external parameter value and the internal parameter value of the pseudo creature after the action of the (n + 1) th linkage information. Is low, the external parameter value and the internal parameter value of the simulated organism before the action of the first linkage information, and (n + 1) pieces of the (n + 1) th linkage information from the first linkage information to the (n + 1) th linkage information. A set of an action that performs an action in the order in which the (n + 1) pieces of association information are arranged, and an external parameter value and an internal parameter value of the pseudo creature after the action of the (n + 1) th association information It is characterized by comprising chain action learning means that is generated as association information and stores the association information as association information if the association information is not stored in the association database means.
[0024]
  In addition, the behavior generation method of the present invention realizes a simulated creature that moves according to a desired motion pattern,The action to be performed by the mimetic creature, which is realized in combination, and the external parameter value and the internal parameter value of the mimetic creature before the action, and the mimetic creature after the action representing the situation before and after the transition A plurality of sets of association information consisting of external parameter values and internal parameter values, and transition probabilities representing the probability of the transition due to the action being established, are stored in plural.Pseudo-biological device with associated database meansFor imitating behavior of simulated organisms in JapanThe step of detecting the situation around the simulated organism as an external parameter value, the step of holding the simulated emotion of the simulated organism as an internal parameter value,The similarity between the current external parameter value and internal parameter value of the simulated creature, the external parameter value and internal parameter value of the simulated creature before the action stored in the association database means, and the transition probability of the action Based on the association database means, the association information for instructing the behavior to be performed by the simulated creatureBased on the action search process to be selected and the selected association informationLet the simulated creature actAction output process;Action based on the selected linkage informationThe external parameter value detected after and the internal parameter value held, and the selected association informationAfter actionWhen the similarity between the external parameter value and the internal parameter value is calculated and the similarity is equal to or greater than a predetermined value, the transition probability of the selected association information is increased, and the similarity is less than the predetermined value. In some cases, the method includes a reliability learning step of reducing the transition probability of the selected association information.
  Further, the behavior generation method of the present invention realizes a simulated creature that moves according to a desired motion pattern, and is realized by combining the motion patterns, and the behavior before and after the transition by the behavior. Representing the external parameter value and the internal parameter value of the simulated creature before the action, and the external parameter value and the internal parameter value of the simulated creature after the action, and the probability that the transition by the action is established. A method for forming a behavior of a simulated organism in a simulated organism apparatus having a plurality of association database means for storing a plurality of association information as a set of association information comprising detecting the situation around the simulated organism as an external parameter value Holding the pseudo-emotion of the simulated organism as an internal parameter value; and Based on the similarity between the parameter value and the internal parameter value, the external parameter value and the internal parameter value of the simulated organism before the action stored in the association database means, and the transition probability of the behavior, Based on the selected association information, an action search step for selecting association information for instructing an action to be performed from the association database means, an action output step for causing the simulated creature to act based on the selected association information, and The similarity between the external parameter value detected after acting and the retained internal parameter value and the external parameter value and internal parameter value after the action of the selected association information is calculated, and the similarity is calculated If it is less than the predetermined value, the external parameter value and the internal parameter before acting based on the selected association information. Data value, the behavior of the selected linkage information, the external parameter value and the internal parameter value after the behavior of the mimetic creature, and the transition probability representing one success in one trial. And a non-target behavior learning step of generating association information as a set and storing the generated association information as association information if the association information is not stored in the association database means.
Further, the behavior generation method of the present invention realizes a simulated creature that moves according to a desired motion pattern, and is realized by combining the motion patterns, and the behavior before and after the transition by the behavior. A plurality of association databases that store a plurality of sets of association information including external parameter values and internal parameter values of the simulated creature before the action and external parameter values and internal parameter values of the simulated creature after the behavior A method for forming a behavior of a simulated organism in a simulated organism apparatus having means, the step of detecting the situation around the simulated organism as an external parameter value, and the step of holding the simulated emotion of the simulated organism as an internal parameter value; The current external parameter value and internal parameter value of the simulated organism are stored in the association database means. Based on the similarity to the external parameter value and intrinsic parameters of the pseudo organism before the action, the association information indicating an action to be performed by the said pseudo-organism Recognizing the behavior of the detected object from the detected external parameter value, a behavior search step to be selected from the association database means, a behavior output step to cause the pseudo creature to behave based on the selected linkage information, Based on the detected external parameter value, the detected external parameter value is decomposed into a part related to the detected object and an environmental part excluding the detected object, and the environmental part is set as the external parameter value of the detected object. Using the dictionary information storing information for specifying the internal parameter value of the detected object, and estimating the internal parameter value of the detected object from the external parameter value detected before and after the recognized action, From the recognized action, the external parameter value of the detected body detected before and after the action, and the external parameter value detected before and after the action The internal parameter value of the detected object estimated using the dictionary information is generated as a set of association information, and the other party action to be stored if the generated association information is not stored in the association database means And a learning step.
Further, the behavior generation method of the present invention realizes a simulated creature that moves according to a desired motion pattern, and is realized by combining the motion patterns, and the behavior before and after the transition by the behavior. Representing the external parameter value and the internal parameter value of the simulated creature before the action, and the external parameter value and the internal parameter value of the simulated creature after the action, and the probability that the transition by the action is established. A method for forming a behavior of a simulated organism in a simulated organism apparatus having a plurality of association database means for storing a plurality of association information as a set of association information comprising detecting the situation around the simulated organism as an external parameter value Holding the pseudo-emotion of the simulated organism as an internal parameter value; and Based on the similarity between the parameter value and the internal parameter value, the external parameter value and the internal parameter value of the simulated organism before the action stored in the association database means, and the transition probability of the behavior, An action search step for selecting association information for instructing an action to be performed from the association database means, an action output step for causing the pseudo-behavior to act based on the selected association information, and the behavior database stored in the association database means From the association information, a plurality of the association information having a parameter value that is substantially the same as the external parameter value after the action and the internal parameter value are extracted, and the other of the extracted association information from which the transition probability is extracted The external parameter value and the internal parameter value before the action of the association information lower than the association information are set as the first parameter. The external parameter value and the internal parameter value before the action of the other association information as the second parameter value, and the first parameter value and the first parameter value as the second parameter value. An action to be changed to a parameter value, a second parameter value, and a transition probability set to a predetermined initial value are generated as a set of association information, and the generated association information is stored in the association database means. And a situation adjustment behavior learning step for storing if not stored.
Further, the behavior generation method of the present invention realizes a simulated creature that moves according to a desired motion pattern, and is realized by combining the motion patterns, and the behavior before and after the transition by the behavior. A plurality of association databases that store a plurality of sets of association information including external parameter values and internal parameter values of the simulated creature before the action and external parameter values and internal parameter values of the simulated creature after the behavior A method for forming a behavior of a simulated organism in a simulated organism apparatus having means for detecting a situation around the simulated organism as an external parameter value, and a pseudo emotion having at least a pleasant emotion of the simulated organism as an internal parameter value Holding the current external parameter value and internal parameter value of the simulated organism, and the association data An action for selecting, from the association database means, association information indicating an action to be performed by the simulated organism based on the similarity between the external parameter value and the internal parameter value of the simulated organism before the action stored in the database unit Of the association information stored in the association database means, the association information stored in the association database means, the first association information, and the first association information Extracting the second association information having the external parameter value and the internal parameter value of the simulated creature before the behavior, which substantially matches the external parameter value and the internal parameter value of the simulated creature after the behavior of the information, External parameter values and internal parameters of the simulated organism before the action of 1 linkage information When the pleasant feeling in the data value is lower than the pleasant feeling in the external parameter value and the internal parameter value of the pseudo creature after the action of the second association information, the action before the action of the first association information The external parameter value and internal parameter value of the simulated organism, the behavior from the first linkage information to the second linkage information, and the external parameter value and the internal parameter of the simulated organism after the behavior of the second linkage information A chain action learning step of generating a value as a set of association information and storing the generated association information as association information if the association information is not stored in the association database means.
Further, the behavior generation method of the present invention realizes a simulated creature that moves according to a desired motion pattern, and is realized by combining the motion patterns, and the behavior before and after the transition by the behavior. A plurality of association databases that store a plurality of sets of association information including external parameter values and internal parameter values of the simulated creature before the action and external parameter values and internal parameter values of the simulated creature after the behavior A method for forming a behavior of a simulated organism in a simulated organism apparatus having means for detecting a situation around the simulated organism as an external parameter value, and a pseudo emotion having at least a pleasant emotion of the simulated organism as an internal parameter value Holding the current external parameter value and internal parameter value of the simulated organism, and the association data An action for selecting, from the association database means, association information indicating an action to be performed by the simulated organism based on the similarity between the external parameter value and the internal parameter value of the simulated organism before the action stored in the database unit Of the association information stored in the association database means, the association information stored in the association database means, the first association information, and the first association information Second association information having external parameter values and internal parameter values of the simulated organism before the behavior, which substantially matches the external parameter values and internal parameter values of the simulated organism after the behavior of the information, and the second association information The external parameter value and the internal parameter value of the simulated organism before the behavior, which substantially match the external parameter value and the internal parameter value of the simulated organism after the behavior of Third association information having a parameter value is extracted, and the pleasant emotion in the external parameter value and the internal parameter value of the pseudo creature before the action of the first association information is obtained after the action of the third association information. When the external parameter value and the internal parameter value of the simulated creature are lower than the pleasant feeling, the external parameter value and the internal parameter value of the simulated creature before the action of the first linkage information, and the first linkage information To the behavior of the second linkage information, the behavior from the second linkage information to the third linkage information, the external parameter value and the internal parameter value of the simulated organism after the behavior of the third linkage information, , As a set of association information, and if the generated association information is not stored in the association database means, a chain action learning step for storing as association information; It is characterized by having.
Further, the behavior generation method of the present invention realizes a simulated creature that moves according to a desired motion pattern, and is realized by combining the motion patterns, and the behavior before and after the transition by the behavior. A plurality of association databases that store a plurality of sets of association information including external parameter values and internal parameter values of the simulated creature before the action and external parameter values and internal parameter values of the simulated creature after the behavior A method for forming a behavior of a simulated organism in a simulated organism apparatus having means for detecting a situation around the simulated organism as an external parameter value, and a pseudo emotion having at least a pleasant emotion of the simulated organism as an internal parameter value Holding the current external parameter value and internal parameter value of the simulated organism, and the association data An action for selecting, from the association database means, association information indicating an action to be performed by the simulated organism based on the similarity between the external parameter value and the internal parameter value of the simulated organism before the action stored in the database unit Of the association information stored in the association database means, the association information stored in the association database means, the first association information, and the first association information N (1), which is a chain of second linked information having external parameter values and internal parameter values of the simulated organism before the behavior, which substantially match the external parameter values and internal parameter values of the simulated organism after the behavior of the information. However, n is a natural number of 2 or more) (n + 1) linked association information is extracted, and the external parameter of the pseudo organism before the action of the first linkage information is extracted. Over data values and internal parameters When the pleasant emotion in the value is lower than the pleasant emotion in the external parameter value and the internal parameter value of the pseudo creature after the action of the (n + 1) th linkage information in the n-th chain, the first linkage information The external parameter value and internal parameter value of the simulated creature before the action, the (n + 1) pieces of action from the first association information to the (n + 1) th association information, and (n + 1) pieces of association information. And the external parameter value and the internal parameter value of the pseudo creature after the behavior of the (n + 1) th association information are generated as a set of association information, and the generated association A chain action learning step of storing information as association information if the information is not stored in the association database means.
[0025]
  In addition, the storage medium of the present invention operates a simulated organism that moves according to a desired operation pattern, and the operation pattern is displayed.The action to be performed by the mimetic creature, which is realized in combination, and the external parameter value and the internal parameter value of the mimetic creature before the action, and the mimetic creature after the action representing the situation before and after the transition A plurality of sets of association information consisting of external parameter values and internal parameter values, and transition probabilities representing the probability of the transition due to the action being established, are stored in plural.A storage medium storing a computer-readable program for operating a simulated biological apparatus having an association database means,
  The situation around the simulated creature is detected as an external parameter value, and the simulated emotion of the simulated creature is held as an internal parameter value,The similarity between the current external parameter value and internal parameter value of the simulated creature, the external parameter value and internal parameter value of the simulated creature before the action stored in the association database means, and the transition probability of the action Based on the association database means, the association information for instructing the behavior to be performed by the simulated creatureBased on the selected association informationLet the simulated creature act,Based on the selected linkage informationThe external parameter value detected later and the retained internal parameter value, and the selected association informationAfter actionWhen the similarity between the external parameter value and the internal parameter value is calculated and the similarity is equal to or greater than a predetermined value, the transition probability of the selected association information is increased, and the similarity is less than the predetermined value. In some cases, the transition probability of the selected association information is reduced.
  In addition, the storage medium of the present invention operates a simulated creature that moves according to a desired motion pattern, and combines the behavior pattern to cause the simulated creature to perform and the situation before and after the transition by the behavior. Represents the external parameter value and internal parameter value of the simulated creature before the action, the external parameter value and internal parameter value of the simulated creature after the action, and the probability that the transition by the action is established A storage medium that stores a computer-readable program for operating a simulated biological apparatus having a plurality of linked database means as a set of linked information consisting of transition probabilities, and the situation around the simulated creature Is detected as an external parameter value, and the pseudo-emotion of the simulated creature is retained as an internal parameter value Similarity between the current external parameter value and internal parameter value of the simulated organism, the external parameter value and internal parameter value of the simulated organism before the behavior stored in the association database means, and the transition of the behavior Based on the probability, the association information instructing the behavior to be performed by the simulated organism is selected from the association database means, and the simulated organism is caused to act based on the selected association information, and based on the selected association information Calculating the similarity between the external parameter value detected after being acted on and the internal parameter value held, and the external parameter value and internal parameter value after the behavior of the selected association information, If the similarity is less than a predetermined value, the external parameter value and the internal value before acting based on the selected association information The parameter value, the behavior of the selected linkage information, the external parameter value and the internal parameter value after the behavior of the mimetic creature, and the transition probability indicating one success in one trial It is characterized in that association information as a pair is generated, and if the generated association information is not stored in the association database means, it is stored as association information.
In addition, the storage medium of the present invention operates a simulated creature that moves according to a desired motion pattern, and combines the behavior pattern to cause the simulated creature to perform and the situation before and after the transition by the behavior. Representing, associative database means for storing a plurality of associative information consisting of external parameter values and internal parameter values of the simulated creature before the action and external parameter values and internal parameter values of the simulated creature after the action A computer-readable storage medium storing a program for operating a simulated biological apparatus, wherein a situation around the simulated biological object is detected as an external parameter value, and the simulated emotion of the simulated biological apparatus is an internal parameter value. The external parameter value and the internal parameter value of the present simulated organism, and External parameter values of the pseudo organism before the action stored in Seki database means and based on the similarity of the intrinsic parameters, the line in the pseudo organism Selecting the association information for instructing the action to be performed from the association database means, causing the pseudo creature to act based on the selected association information, causing the behavior of the detected object to be recognized from the detected external parameter value, The detected external parameter value is decomposed into a part related to the detected object and an environmental part excluding the detected object, and the environmental part is set as the external parameter value of the detected object, and the detected external parameter value is converted into the detected external parameter value. The internal parameter value of the detected object is estimated from the external parameter value detected before and after the recognized action using dictionary information storing information for specifying the internal parameter value of the detected object based on The recognized action, the external parameter value of the detected object detected before and after the action, and the external parameter value detected before and after the action. The internal parameter value of the detected object estimated using the dictionary information is generated as a set of association information, and the generated association information is stored if not stored in the association database means. Features.
In addition, the storage medium of the present invention operates a simulated creature that moves according to a desired motion pattern, and combines the behavior pattern to cause the simulated creature to perform and the situation before and after the transition by the behavior. Represents the external parameter value and internal parameter value of the simulated creature before the action, the external parameter value and internal parameter value of the simulated creature after the action, and the probability that the transition by the action is established A storage medium that stores a computer-readable program for operating a simulated biological apparatus having a plurality of linked database means as a set of linked information consisting of transition probabilities,
The situation around the simulated organism is detected as an external parameter value, the simulated emotion of the simulated organism is retained as an internal parameter value, and the current external parameter value and internal parameter value of the simulated organism are stored in the association database means Based on the similarity between the external parameter value and the internal parameter value of the simulated creature before the performed behavior and the transition probability of the behavior, association information for instructing the behavior to be performed by the simulated creature from the association database unit The external parameter value after the action and the internal parameter value have substantially the same parameter value from the association information stored in the association database means. A plurality of the association information is extracted, and a transition probability is extracted from the extracted association information. The external parameter value and the internal parameter value before the action of the association information lower than the other association information are set as a first parameter value, and the external parameter value and the internal parameter before the action of the other association information The value is a second parameter value, the first parameter value, the action of changing the first parameter value to the second parameter value, the second parameter value, and a predetermined initial value are set. The generated transition probabilities are generated as a set of association information, and if the generated association information is not stored in the association database means, it is stored as association information.
In addition, the storage medium of the present invention operates a simulated creature that moves according to a desired motion pattern, and combines the behavior pattern to cause the simulated creature to perform and the situation before and after the transition by the behavior. Representing, associative database means for storing a plurality of associative information consisting of external parameter values and internal parameter values of the simulated creature before the action and external parameter values and internal parameter values of the simulated creature after the action A computer-readable storage medium storing a program for operating a pseudo-biological apparatus having the pseudo-biological apparatus, detecting a situation around the pseudo-biology as an external parameter value and having at least a pleasant feeling of the pseudo-biology The emotion is held as an internal parameter value, and the current external parameter value of the simulated organism and Based on the similarity between the external parameter value and the internal parameter value of the pre-behavior stored in the association database means, the association information for instructing the action to be performed by the mimetic The first association information and the first association information among the association information stored in the association database means are selected from the association database means, and the simulated organism is caused to act based on the selected association information. Second association information having the external parameter value and the internal parameter value of the simulated creature before the action, which substantially match the external parameter value and the internal parameter value of the simulated creature after the behavior of The pleasant feeling in the external parameter value and the internal parameter value of the pseudo-biology before the action of the association information is the action of the second association information External para of the pseudo organism When it is lower than the pleasant feeling in the meter value and the internal parameter value, the second association is calculated from the external parameter value and the internal parameter value of the simulated organism before the action of the first association information and the first association information. The behavior up to the information and the external parameter value and the internal parameter value of the pseudo creature after the behavior of the second linkage information are generated as a set of linkage information, and the generated linkage information is the linkage database means. If it is not stored, it is stored as association information.
In addition, the storage medium of the present invention operates a simulated creature that moves according to a desired motion pattern, and combines the behavior pattern to cause the simulated creature to perform and the situation before and after the transition by the behavior. Representing, associative database means for storing a plurality of associative information consisting of external parameter values and internal parameter values of the simulated creature before the action and external parameter values and internal parameter values of the simulated creature after the action A computer-readable storage medium storing a program for operating a pseudo-biological apparatus having the pseudo-biological apparatus, detecting a situation around the pseudo-biology as an external parameter value and having at least a pleasant feeling of the pseudo-biology The emotion is held as an internal parameter value, and the current external parameter value of the simulated organism and Based on the similarity between the external parameter value and the internal parameter value of the pre-behavior stored in the association database means, the association information for instructing the action to be performed by the mimetic The first association information and the first association information among the association information stored in the association database means are selected from the association database means, and the simulated organism is caused to act based on the selected association information. Second association information having the external parameter value and the internal parameter value of the simulated organism before the behavior, which substantially match the external parameter value and the internal parameter value of the simulated organism after the behavior, and the second association information The external parameter values and internal parameters of the simulated creature before the action that substantially match the external parameter values and internal parameter values of the simulated creature after the behavior. Third association information having a parameter value is extracted, and the pleasant emotion in the external parameter value and the internal parameter value of the pseudo organism before the action of the first association information is obtained after the action of the third association information. When the external parameter value and the internal parameter value of the simulated creature are lower than the pleasant feeling, the external parameter value and the internal parameter value of the simulated creature before the action of the first linkage information, and the first linkage information To the behavior of the second linkage information, the behavior from the second linkage information to the third linkage information, the external parameter value and the internal parameter value of the simulated organism after the behavior of the third linkage information, Are generated as a set of association information, and if the generated association information is not stored in the association database means, it is stored as association information. To do.
In addition, the storage medium of the present invention operates a simulated creature that moves according to a desired motion pattern, and combines the behavior pattern to cause the simulated creature to perform and the situation before and after the transition by the behavior. Representing, associative database means for storing a plurality of associative information consisting of external parameter values and internal parameter values of the simulated creature before the action and external parameter values and internal parameter values of the simulated creature after the action A computer-readable storage medium storing a program for operating a pseudo-biological apparatus having the pseudo-biological apparatus, detecting a situation around the pseudo-biology as an external parameter value and having at least a pleasant feeling of the pseudo-biology The emotion is held as an internal parameter value, and the current external parameter value of the simulated organism and Based on the similarity between the external parameter value and the internal parameter value of the pre-behavior stored in the association database means, the association information for instructing the action to be performed by the mimetic The first association information and the first association information among the association information stored in the association database means are selected from the association database means, and the simulated organism is caused to act based on the selected association information. N (wherein the second association information having the external parameter value and the internal parameter value of the simulated creature before the behavior, which substantially matches the external parameter value and the internal parameter value of the simulated creature after the behavior) (n is a natural number of 2 or more) Linked (n + 1) pieces of the linkage information are extracted, and the external pattern of the pseudo organism before the action of the first linkage information is extracted. Meter value and the Pleasantness inside parameter values, the n chain th of the (n + 1) the pseudo after action association information When lower than the pleasant emotion in the external parameter value and internal parameter value of the organism, the external parameter value and internal parameter value of the simulated organism before the action of the first association information and the first association information from the first association information (N + 1) actions up to (n + 1) association information in the order in which (n + 1) pieces of association information are arranged, and the pseudo organism after the action of the (n + 1) th association information The external parameter value and the internal parameter value are generated as a set of association information, and if the generated association information is not stored in the association database means, it is stored as association information.
[0026]
  Further, the computer program of the present invention operates a simulated organism that moves according to a desired operation pattern, and displays the operation pattern.The action to be performed by the mimetic creature, which is realized in combination, and the external parameter value and the internal parameter value of the mimetic creature before the action, and the mimetic creature after the action representing the situation before and after the transition A plurality of sets of association information consisting of external parameter values and internal parameter values, and transition probabilities representing the probability of the transition due to the action being established, are stored in plural.A computer program for operating a simulated biological apparatus having an association database means, a function of detecting the situation around the simulated biological object as an external parameter value, and a function of retaining a simulated emotion of the simulated biological object as an internal parameter value;The similarity between the current external parameter value and internal parameter value of the simulated creature, the external parameter value and internal parameter value of the simulated creature before the action stored in the association database means, and the transition probability of the action Based on the association database means, the association information for instructing the behavior to be performed by the simulated creatureBased on the function to be selected and the selected association informationTake action on the simulated creatureFunctionBased on the selected linkage informationThe external parameter value detected later and the retained internal parameter value, and the selected association informationAfter actionA function for calculating the similarity between the external parameter value and the internal parameter value, and when the similarity is equal to or greater than a predetermined value, the transition probability of the selected association information is increased, and the similarity is a predetermined value. If it is less, the function of reducing the transition probability of the selected association information is provided.
  In addition, the computer program of the present invention operates a simulated creature that moves according to a desired motion pattern, and combines the behavior pattern to realize the behavior to be performed by the simulated creature and the situation before and after the transition by the behavior. Represents the external parameter value and internal parameter value of the simulated creature before the action, the external parameter value and internal parameter value of the simulated creature after the action, and the probability that the transition by the action is established A computer program for operating a simulated biological apparatus having a plurality of association database means for storing as a set of association information consisting of transition probabilities, and a function for detecting a situation around the simulated organism as an external parameter value; The function to hold the pseudo-animated emotions as internal parameter values, Based on the external parameter value and internal parameter value of the simulated creature, the similarity between the external parameter value and internal parameter value of the simulated creature before the action stored in the association database means, and the transition probability of the action Based on the selected association information, a function for selecting the association information for instructing the behavior to be performed by the simulated organism from the association database means, a function for causing the simulated organism to behave based on the selected association information, and A function for calculating the similarity between the external parameter value detected after being acted on and the internal parameter value held and the external parameter value and internal parameter value after the behavior of the selected association information; If the similarity is less than a predetermined value, the external parameter before acting on the selected association information is taken. Data and internal parameter values, the behavior of the selected linkage information, the external parameter values and the internal parameter values after the behavior of the simulated creature, and the transition probability representing one success in one trial And a set of association information. If the generated association information is not stored in the association database means, the association information is stored as association information.
In addition, the computer program of the present invention operates a simulated creature that moves according to a desired motion pattern, and combines the behavior pattern to realize the behavior to be performed by the simulated creature and the situation before and after the transition by the behavior. Representing, associative database means for storing a plurality of associative information consisting of external parameter values and internal parameter values of the simulated creature before the action and external parameter values and internal parameter values of the simulated creature after the action A computer program for operating a pseudo-biological device having a function of detecting a situation around the pseudo-biology as an external parameter value, a function of holding a pseudo-emotion of the pseudo-biology as an internal parameter value, and the current External parameter values and internal parameter values of the simulated organism, and the association data Based on the similarity to the external parameter value and intrinsic parameters of the pseudo organism before the action stored in the over scan means, actions to be performed by the said pseudo-organism A function for selecting the association information instructing the association database means from the association database means, a function for causing the simulated creature to act based on the selected association information, and recognizing the behavior of the detected object from the detected external parameter value. The detected external parameter value is decomposed into a part related to the detected object and an environmental part excluding the detected object, and the environmental part is set as the external parameter value of the detected object, and the detected external parameter value The internal parameter value of the detected object is estimated from the external parameter values detected before and after the recognized action using dictionary information storing information for specifying the internal parameter value of the detected object based on The recognized action, the external parameter value of the detected object detected before and after the action, and the external parameter detected before and after the action. The internal parameter value of the detected object estimated from the value using the dictionary information is generated as a set of association information, and if the generated association information is not stored in the association database means, it is stored. And having a function.
In addition, the computer program of the present invention operates a simulated creature that moves according to a desired motion pattern, and combines the behavior pattern to realize the behavior to be performed by the simulated creature and the situation before and after the transition by the behavior. Represents the external parameter value and internal parameter value of the simulated creature before the action, the external parameter value and internal parameter value of the simulated creature after the action, and the probability that the transition by the action is established A computer program for operating a simulated biological apparatus having a plurality of association database means for storing as a set of association information consisting of transition probabilities, and a function for detecting a situation around the simulated organism as an external parameter value; The function to hold the pseudo-animated emotions as internal parameter values, Based on the external parameter value and internal parameter value of the simulated creature, the similarity between the external parameter value and internal parameter value of the simulated creature before the action stored in the association database means, and the transition probability of the action Stored in the association database means, a function for selecting association information for instructing an action to be performed by the simulated creature from the association database means, a function for causing the simulated creature to act based on the selected association information, From the association information, the external parameter value after the action and the internal parameter value are extracted with a plurality of the association information having substantially the same parameter value, and the transition probability is extracted from the extracted association information. The external parameter value and the internal parameter value before the action of the association information lower than the association information are set to a first A parameter value, the external parameter value and the internal parameter value before the action of the other association information as a second parameter value, and the first parameter value and the first parameter value as the second parameter value. An action to be changed to a parameter value, a second parameter value, and a transition probability set to a predetermined initial value are generated as a set of association information, and the generated association information is stored in the association database means. If not stored, it has a function of storing it as association information.
In addition, the computer program of the present invention operates a simulated creature that moves according to a desired motion pattern, and combines the behavior pattern to realize the behavior to be performed by the simulated creature and the situation before and after the transition by the behavior. Representing, associative database means for storing a plurality of associative information consisting of external parameter values and internal parameter values of the simulated creature before the action and external parameter values and internal parameter values of the simulated creature after the action A computer program for operating a pseudo-biological device having a function of detecting a situation around the pseudo-biology as an external parameter value, and a function of retaining a pseudo-emotion having at least the pleasant feeling of the pseudo-biology as an internal parameter value And the external parameter values and internal parameters of the present simulated organism On the basis of the similarity between the external parameter value and the internal parameter value of the simulated organism before the action stored in the association database means, A function of selecting from the database means, a function of causing the simulated creature to act based on the selected association information,
Of the association information stored in the association database means, the first association information and the external parameter value and the internal parameter value of the simulated creature after the behavior of the first association information substantially coincide with each other before the behavior. Second association information having an external parameter value and an internal parameter value of the simulated organism, and the pleasant feeling in the external parameter value and the internal parameter value of the simulated organism before the action of the first association information is extracted. , The pseudo after the action of the second linkage information When lower than the pleasant emotion in the external parameter value and internal parameter value of the organism, the external parameter value and internal parameter value of the simulated organism before the action of the first association information and the first association information from the first association information 2 and the external parameter value and the internal parameter value of the pseudo creature after the behavior of the second linkage information are generated as a set of linkage information, and the generated linkage information is If it is not stored in the association database means, it has a function of storing it as association information.
In addition, the computer program of the present invention operates a simulated creature that moves according to a desired motion pattern, and combines the behavior pattern to realize the behavior to be performed by the simulated creature and the situation before and after the transition by the behavior. Representing, associative database means for storing a plurality of associative information consisting of external parameter values and internal parameter values of the simulated creature before the action and external parameter values and internal parameter values of the simulated creature after the action A computer program for operating a pseudo-biological device having a function of detecting a situation around the pseudo-biology as an external parameter value, and a function of retaining a pseudo-emotion having at least the pleasant feeling of the pseudo-biology as an internal parameter value And the external parameter values and internal parameters of the present simulated organism On the basis of the similarity between the external parameter value and the internal parameter value of the simulated organism before the action stored in the association database means, A function to be selected from the database means, a function to cause the simulated creature to act based on the selected relation information, and the first relation information among the relation information stored in the relation database means, and the first Second association information having the external parameter value and the internal parameter value of the simulated organism before the action substantially matching the external parameter value and the internal parameter value of the simulated organism after the behavior of the association information, The external parameter value of the simulated organism before the action that substantially matches the external parameter value and the internal parameter value of the simulated organism after the action of the association information And the third association information having an internal parameter value are extracted, and the pleasant parameter in the external parameter value and the internal parameter value of the pseudo-biology before the action of the first association information is the third association information of the third association information. When lower than the pleasant feeling in the external parameter value and the internal parameter value of the simulated creature after the action, the external parameter value and the internal parameter value of the simulated creature before the action of the first association information, and the first The behavior from the association information to the behavior of the second linkage information, the behavior from the second linkage information to the third linkage information, and the external parameter values and the internal parameters of the simulated organism after the behavior of the third linkage information A value, and a function of storing the generated association information as association information if the association information is not stored in the association database means; Have.
In addition, the computer program of the present invention operates a simulated creature that moves according to a desired motion pattern, and combines the behavior pattern to realize the behavior to be performed by the simulated creature and the situation before and after the transition by the behavior. Representing, associative database means for storing a plurality of associative information consisting of external parameter values and internal parameter values of the simulated creature before the action and external parameter values and internal parameter values of the simulated creature after the action A computer program for operating a pseudo-biological device having a function of detecting a situation around the pseudo-biology as an external parameter value, and a function of retaining a pseudo-emotion having at least the pleasant feeling of the pseudo-biology as an internal parameter value And the external parameter values and internal parameters of the present simulated organism On the basis of the similarity between the external parameter value and the internal parameter value of the simulated organism before the action stored in the association database means, A function to be selected from the database means, a function to cause the simulated creature to act based on the selected relation information, and the first relation information among the relation information stored in the relation database means, and the first The second association information having the external parameter value and the internal parameter value of the simulated organism before the behavior, which substantially matches the external parameter value and the internal parameter value of the simulated organism after the behavior of the association information of the n (where n is a natural number of 2 or more) chained (n + 1) pieces of the association information are extracted, and the pseudo organism before the action of the first association information is extracted. The Pleasantness in section parameter values and the internal parameter values, before the after action of the n associated information chain th of the (n + 1) When the external parameter value and the internal parameter value of the simulated creature are lower than the pleasant emotion, the external parameter value and the internal parameter value of the simulated creature before the action of the first linkage information, and the first linkage information The (n + 1) number of actions up to the (n + 1) th association information are performed in the order in which the (n + 1) pieces of association information are arranged, and the action after the action of the (n + 1) th association information A function of generating the external parameter value and the internal parameter value of the simulated organism as a set of association information, and storing the generated association information as association information if the association information is not stored in the association database means.
[0031]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0032]
The pseudo-biology provided by the pseudo-biological device of the present invention has an anthropomorphic or pseudo-biological form as its outer shape. For example, in the case of an animal, a hamster, a cat, a monkey, a dog, a rabbit, a parrot, a bear , Imitating whales, and if it is a plant, it is imitating sunflower, maple, sweet basil, etc.
[0033]
For this reason, the simulated biological apparatus of the present invention may be a computer (electronic device) capable of displaying the shape of the simulated creature or a robot that simulates the simulated creature.
[0034]
1 to 4 show a first embodiment in which a simulated biological system according to the present invention is implemented by a robot.
[0035]
FIG. 1 is a perspective view of a dog-shaped robot.
[0036]
The outer shape of the robot 1 is substantially a dog, and includes a plurality of movable parts and a main body. The movable part includes a head 2, a right arm 3, a left arm 4, a right foot 5, a left foot 6, and a tail 7. The main body is the trunk portion 8. Further, the head portion 2, the right arm portion 3, the left arm portion 4, the right foot portion 5, the left foot portion 6, and the tail 7 are connected to the body portion 8 through joints, and can move with respect to the body portion 8. The joint is provided with a motor that generates a driving force, and an angle sensor that detects a momentary posture (joint angle) of each unit that is driven by the driving force of the motor being transmitted.
[0037]
In addition, the head 2 has a blinkable LED 9 and an imaging camera 10 and an infrared distance sensor 11 with different emission colors at the part corresponding to the eyes, the microphone 12 at the part corresponding to the ear, and the part corresponding to the mouth. A speaker 13 and a pressure sensor 14 are provided at locations corresponding to the forehead. The part corresponding to the mouth and the part corresponding to the ear can move in a predetermined direction.
[0038]
Further, pressure sensors 14 are also provided on the right arm part 3, the left arm part 4, the right foot part 5, the left foot part 6, the tail 7, and the body part 8, respectively.
[0039]
Next, FIG. 2 is a block diagram of the robot.
[0040]
A control unit 15 is built in the body unit 8. The control unit 15 includes a CPU 16 and a memory 17 composed of ROM and RAM. The CPU 16 receives signals from various sensors (imaging camera 10, infrared distance sensor 11, microphone 12, speaker 13, pressure sensor 14, angle sensor) provided in each movable part, and drives the motor of each joint. It is connected so that the signal for making it output can be output.
[0041]
Next, the function of the present invention will be described with reference to the block diagram for explaining the function of the present invention shown in FIG.
[0042]
The functions of this robot will be explained in terms of "behavior expression ability" and "behavior formation ability".
・ Behavior expression ability
A configuration for causing the behavior expression ability to function is a situation input unit 21, an association database unit 22, a behavior search unit 23, and a behavior output unit 24.
[0043]
The situation input unit 21 includes various sensors (movable parts of the robot 1, an imaging camera 10, an infrared distance sensor 11, a microphone 12, a pressure sensor 14, an angle sensor for each joint) provided from the main body, This is realized by the CPU 16 that receives and processes the signal, and a part of the memory 17 that stores and holds the signal and its processing result. That is, the CPU 16 executes processing for recognizing signals from various sensors.
[0044]
Further, the association database unit 22 is realized using a part of the memory 17.
[0045]
The behavior search unit 23 is realized by the CPU 16.
[0046]
Further, the behavior output unit 24 is realized by various output devices (LED9, speaker 13, motor of each joint), a CPU 16 that controls various output devices, and a part of a memory 17 that stores information for the control. In other words, the CPU 16 executes processing for outputting the robot operation and facial expression through various output devices.
[0047]
First, the situation input unit 21 obtains situation data inside and outside the robot 1. This situation data has M (M is a natural number) parameter values, and these M parameters indicate external state parameters (external parameter values) related to information obtained from the outside of the robot 1 and the internal state of the robot 1. It consists of the internal state parameters (internal parameter values) shown.
[0048]
The external state parameters are detected by the imaging camera 10, the capacitive distance sensor 11, the microphone 12, and the pressure sensor 14, and the presence of the detected body, the emotional state and behavior of the detected body, the detected body or the robot 1 itself As a result of the action, the state of the surrounding environment detected by the robot 1 is shown. For example, the object to be detected is a person, the emotional state of the object to be detected is human emotion, the behavior of the object to be detected is an action that a person runs, and the result of the action is a human being It is a state where it hits something when it runs, and the environmental state is how many people around the robot 1 are in what direction.
[0049]
The internal state parameter is determined by the robot 1 as a result of the robot 1's own pseudo emotions and desires, the robot 1's judgment on the detected object's preference, and the like. Whether or not the robot 1 is acting. For example, a desire is a desire such as a feeling of hunger that occurs over time, a pseudo emotion is an irritated feeling that is felt when you have a feeling of hunger, and an action is that the detected object is a human being It is an action that approaches when it is judged, and whether or not it is in action is whether or not it is approaching the detected object after detecting the detected object, and if the detected object is a human, This includes the feeling of satisfaction that the robot 1 generates when the head 2 is stroked close by (the pressing force detected by the pressure sensor 14 is small and there is contact for a long time) and the memory of a stroked human face. .
[0050]
Such external state parameters and internal state parameters include symbol data such as ID numbers for identifying events, things, and actions that can be handled by the robot, and numerical values that represent the robot's simulated emotions and desire strength values. Indicated in the data.
[0051]
The symbol data is as shown in Table 1 below.
[Table 1]
Figure 0003854061
The numerical data is as shown in Table 2 below. The range of intensity values is, for example, 256 levels from 0 to 255.
[Table 2]
Figure 0003854061
When there are K parameters (K ≦ M) describing numerical data, these parameters can be handled as a single K-dimensional vector composed of K scalar quantities. Further, each parameter of the numerical data is preliminarily defined with a weight corresponding to its importance. Each parameter value is multiplied by a predetermined weighting factor and then collected as a vector, and further, the length of the vector (norm) ) Is normalized to 1. If this normalized vector is defined as a situation vector, the situation characteristics indicated by the numerical data can be represented by the direction of the situation vector.
[0052]
Data consisting of M parameters as situation data and one situation vector generated from K numerical data of the parameters will be referred to as situation information.
[0053]
This status information is periodically detected and formed at a predetermined period T, and the latest L period, that is, a period (T × L) equivalent is stored in a ring buffer provided in the memory 17. That is, when new situation information is detected and formed, the oldest situation information in the ring buffer is discarded and replaced with the latest one. The list of status information for the latest L cycles stored in the ring buffer is called a status information sequence.
[0054]
In addition, the situation input unit 21 is provided with three ring buffers for storing a situation information sequence in order to form a robot action, which will be described later.
[0055]
The first is a ring buffer 1 for storing the latest status information sequence updated with the formation of periodic status information by the status input unit 21. The second is a ring buffer 2 for storing situation information until immediately before the start of robot action. The third is a ring buffer 3 for storing status information immediately after the completion of robot action.
[0056]
The ring buffer 1 represents the current situation inside and outside the robot. The ring buffer 2 is a copy of the entire contents of the ring buffer 1 when the robot starts to act, and an actual situation Jic before the action, which will be described later, is read as the contents of the ring buffer 2. The ring buffer 3 is a copy of the situation information for the L period from the time when the robot completes the action along with the update of the ring buffer 1, and the actual situation Jdc after the action described later is the ring buffer 3 As the contents of That is, the ring buffers 2 and 3 are buffers for storing the situation before and after the action, and the robot should read out and use the situation before and after the action of itself. Can do.
[0057]
The association database unit 22 stores association information R (described later). The association database unit 22 is formed by using a part of the memory 17, and in addition to this, the memory 17 is used for the robot to recognize events and things such as a user and a desk by signals from various sensors. Holds pattern dictionary information, body control information and output sound data necessary for robot behavior (motion and facial expression), external state parameters formed by state input unit 21, and state information string formed from internal state parameters The ring buffers 1 to 3 for performing various operations and various provisional or permanent information for operating and learning the robot are stored.
[0058]
The relation information R is a situation information string representing Ji and a situation information string representing Jd when there is an action Ac that changes the situation from one situation Ji to another situation Jd (described as Ji + Ac → Jd). And one piece of action information representing Ac, and is described as R = [Ji, Ac, Jd]. The situation information Ji and Jd possessed by the linkage information is an enumeration of situation information (situation information series) for L cycles that the situation input unit 21 will observe under each situation, and such situation information strings are observed. It is sample data indicating that it is Ji or Jd.
[0059]
Ji at this time is referred to as an initial situation, Jd is referred to as a target situation, and an action Ac that causes a transition from Ji to Jd is referred to as a situation transition action. The situation transition action Ac includes ID information (for example, 0002 “walk” in Table 1) for identifying the unit action (action element) illustrated in Table 1 above, and the action unit action identified by this ID information. Action element comprising timing information (for example, after 0 seconds) for executing (action element) and action parameter information indicating an action target (for example, 0001 “user” in Table 1) added as necessary It is configured as a list containing one or more pieces of information. For example, the association information is as follows.
[0060]
Figure 0003854061
In addition, the situation transition action Ac includes one or more pieces of action piece information instructing unit movements such as walking, barking, and looking around. The action piece information includes a plurality of pieces of action piece information, for example, “search for the main voice while walking. (The action segment information may be walking, searching for the main voice)). Furthermore, depending on the situation Ji, just waiting without doing anything may automatically lead to the situation Jd, and the action information Ac that has only one action element `` wait '' that does not specify the target will act as a result To express.
[0061]
Next, the behavior search unit 23 compares the current situation Jic output from the situation input unit 21 with the initial situation Ji of the association information R = [Ji, Ac, Jd] stored in the association database unit 22. .
[0062]
The comparison is performed by obtaining score information Sc calculated from the current situation Jic and the initial situation Ji. The score information Sc (Jic, R) of the linkage information R for the current situation Jic is the situation suitability A (Jic, R), the situation improvement effect E (R), the transition probability S (R), and the ease of execution W (R). These parameters are expressed as Sc (Jic, R) = [A (Jic, R), E (R), S (R), W (R)]. One solution association information is extracted from multiple association information R based on score information Sc (Jic, R) = [A (Jic, R), E (R), S (R), W (R)] Is done.
[0063]
Here, a method of calculating the four parameters A (Jic, R), E (R), S (R), and W (R) will be described.
(1) Situation suitability A (Jic, R)
Situation similarity Sj (Ja, Jb) is defined as a scale for evaluating the similarity between two situations Ja and Jb. The situation similarity Sj (Ja, Jb) of situation Ja and Jb is the similarity Sk (Ja, Jb) of ((MK) × L) symbol data that each of Ja and Jb has, and each of Ja and Jb Is calculated as a product of similarity Sv (Ja, Jb) of (K × L) pieces of numerical data, that is, Sj (Ja, Jb) = Sk (Ja, Jb) × Sv (Ja, Jb).
[0064]
The similarity Sk (Ja, Jb) of the symbol data information is the number of times (MK) × L) that the symbol data for L periods coincide with each other at each time (MK) held by Ja and Jb. Calculated as a normalized value. The range of the value of Sk (Ja, Jb) is {Sk (Ja, Jb): 0 ≦ Sk (Ja, Jb) ≦ 1}. At this time, as Sk (Ja, Jb) is closer to 1, the symbol data of the two situations Ja and Jb match, and conversely, the closer to 0, the different.
[0065]
The similarity Sv (Ja, Jb) of the numerical data is obtained by calculating the inner product {Ip = (Va · Vb): −1 ≦ Ip ≦ 1} of the situation vectors Va and Vb at each time possessed by Ja and Jb respectively. It is obtained as an average value for the period. Since the value of the numerical data constituting the situation vector is 0 or more, all the situation vectors are always in the first quadrant of the K-dimensional superspace, and the angle formed by these two situation vectors Va and Vb is 0 to 90 degrees. Up to. Therefore, the range of the inner product value of Va and Vb is actually {Ip = (Va · Vb): 0 ≦ Ip ≦ 1}, and the value of Sv (Ja, Jb) obtained by averaging the L periods The range of {Sv (Ja, Jb): 0 ≦ Sv (Ja, Jb) ≦ 1} is also satisfied. The closer Sv (Ja, Jb) is to 1 (that is, the perfect match at the angle of 0 degrees), the more the numerical data of the two situations Ja and Jb match, and vice versa, The closer to (orthogonal), the different.
[0066]
The situation similarity Sj (Ja, Jb) is obtained as Sk (Ja, Jb) × Sv (Ja, Jb). The range of the value of the situation similarity Sj (Ja, Jb) is {Sj (Ja, Jb): 0 ≦ Sj (Ja, Jb) ≦ 1}, and the closer this Sj (Ja, Jb) is to 1, the more 2 The two situations Ja and Jb are identical in terms of symbols and numerical values, and conversely, the closer to 0, the more different.
[0067]
Here, the situation similarity Sj (Jic, Ji) between the actual situation Jic before the transition and the initial situation Ji of the association information R = [Ji, Ac, Jd] is defined as the situation suitability A (Jic, R). Define. If this A (Jic, R) is equal to or greater than a predetermined threshold, the current situation Jic is very similar to the initial situation Ji of the linkage information R, and R shows the action Ac indicated by R in this situation Jic. There is a possibility of reaching the target situation Jd. The situation similarity Sj (Jdc, Jd) between the actual situation Jdc after the transition and the target situation Jd of the association information R = [Ji, Ac, Jd] is called a transition achievement degree B (Jdc, R). I will decide. This is a measure of how much the actual situation Jdc after the transition matches the intended situation Jd, that is, how well the objective transition is achieved. If this B (Jdc, R) is equal to or greater than the predetermined threshold, the post-transition situation Jdc is very similar to the objective situation Jd of the association information R, and the purpose indicated by R by performing the action Ac indicated by R The situation Jd has been reached, that is, the transition has been successful.
(2) Situation improvement effect E (R)
The situation improvement effect E (R) related to certain linkage information R = [Ji, Ac, Jd] is how the pleasant emotion strength C of the robot 1 changes before and after the situation transition action Ac indicated by R (Ji and Jd). This is what I asked for. The pleasant emotion strength C is a parameter indicating the pleasant emotion of the robot obtained from the pseudo emotion and desire in the internal state parameter, and is described as C (J) for the situation J.
[0068]
The pleasant feeling of the robot 1 changes according to the result of judgment on the object to be detected existing in the outside world or the satisfaction of the desire. For example, if a robot finds something that it likes or loves, collaborates with a favorite partner, or opposes a disliked person, detects a target that can satisfy a need, and if the desire is actually satisfied, Increase the value of pleasant emotion strength C. The upper limit of C at this time is 1. Also, in the opposite situation, if a robot dislikes or dislikes an opponent, if it cannot cooperate with a favorite opponent or if it benefits a disliked person, it detects a target that can satisfy the needs. If the subject disappears later before satisfaction, the value of pleasant emotion strength C is reduced. The lower limit of C at this time is -1.
[0069]
Thus, the pleasant emotion strength C (J) functions as a scale for evaluating the preference of the situation J for the robot 1. And the difference between the emotional intensity C (Jd) and C (Ji) in the objective situation Jd and the initial situation Ji of the linkage information R = [Ji, Ac, Jd] {E (R) = C (Jd) -C (Ji ): The more positively −2 ≦ E (R) ≦ 2}, the more favorable the situation is by the situation transition action Ac.
(3) Transition probability S (R)
The transition probability S (R) for a given piece of association information R = [Ji, Ac, Jd] represents the probability that the linkage information R = [Ji, Ac, Jd] is correct (successful). is there. This is because, due to an uncertain factor in the outside world, it is not known whether the target situation Jd can be reliably reached even if the situation transition action Ac described in the association information R is executed in the initial situation Ji. When the situation transition action Ac was performed and the target situation Jd was reached, the transition was successful (association information was established), that is, this association information R correctly indicated the actual transition (Ji + Ac → Jd) It turns out that.
[0070]
The transition probability S (R) is calculated for each piece of association information within a range of values of {S (R): 0 ≦ S (R) ≦ 1}. The transition probability S (R) for the association information R is described, and the quotient S (R) / = Ns (R) between the number of executions Nt (R) of the association information R and the number of times Ns (R) the transition has actually succeeded ) / Nt (R). However, the quotient Ns (R) / Nt (R) cannot be defined because Nt (R) = 0 and Ns (R) = 0 in the initial state where the linkage information R has never been executed. The transition probability in this case is assumed to be S (R) = 0. Nt (R), Ns (R), and S (R) related to the association information R are collectively expressed as transition probability information Si (R) = [Ns (R), Nt (R), S (R)].
(4) Ease of execution W (R)
The ease of execution W (R) related to a certain piece of association information R = [Ji, Ac, Jd] is how low the cost for executing the action Ac indicated by the relation information R, that is, how easy the action Ac is to be executed. It is a scale to measure. The ease of execution W (R) is calculated as the reciprocal {U (Ac): 0 ≦ U (Ac) ≦ 1} of the number of action elements constituting the action Ac (at least one). Here, U (Ac) is called a labor saving index of action Ac, and it becomes larger as the action Ac is completed with less action. The range of values of the ease of execution W (R) is {W (R): 0 <W (R) ≦ 1}, and the larger the W (R), the simpler the action is completed with less action. Represents that.
[0071]
After obtaining such (1) to (4), one solution relation information R is extracted. Specifically, the situation suitability A (R) is equal to or greater than a predetermined threshold, and the product of the situation improvement effect E (R), the transition probability S (R) and the ease of execution W (R), that is, the situation improvement expectation level { Ep (R) = E (R) × S (R) × W (R): a value that satisfies −2 ≦ Ep (R) ≦ 2} is equal to or larger than a predetermined threshold and is maximized. In other words, the selected solution linkage information is the best that the situation can be improved with less effort out of the applicable actions (situation suitability A is greater than or equal to a predetermined threshold) that the robot knows about the current situation Ji. (Situation improvement expectation degree Ep becomes the maximum when it is not less than a predetermined threshold value).
[0072]
Next, the behavior output unit 24 executes the content of the behavior segment information at a predetermined timing based on the solution association information selected by the behavior search unit 23.
[0073]
For example, suppose that the robot was alone in the room and was lonely (situation Jic). The score information Sc described above is calculated, and association information (candidate association information) having an initial situation similar to the situation Jic is extracted from the association database unit 22. Assume that there are the following three pieces of extracted association information.
[0074]
Figure 0003854061
At this time, assuming that the threshold of situation improvement expectation Ep is 0.1, the linkage information R2 that exceeds the threshold and has the maximum situation improvement expectation Ep = 0.5 is selected as the solution linkage information that most improves the situation Jic. The
[0075]
The robot performs a body motion by moving the motor of each movable part while outputting a bark from the speaker 13 according to the selected linkage information R2.
・ Behavior formation ability
The configuration for causing the behavior forming ability to function is the reliability learning unit 25, the non-target behavior learning unit 26, the other person behavior learning unit 27, the situation adjustment behavior learning unit 28, and the chain behavior learning unit 29.
[0076]
The reliability learning unit 25, the non-target behavior learning unit 26, the other person behavior learning unit 27, the situation adjustment behavior learning unit 28, and the chain behavior learning unit 29 are realized solely by the CPU 16 and the memory 17 in the control unit 15. The That is, the processing performed by these components is executed by the CPU 16.
[0077]
This behavior-forming ability has the following four abilities.
1. Behavior search ability
2. Behavioral replication ability
3. Situation adjustment ability
4.Action planning ability
Each of the above-mentioned abilities is linked to the reliability learning unit 25 and the non-target behavior learning units 26 and 2 to the other person behavior learning units 27 and 3 to the situation adjustment behavior learning units 28 and 4 to 1. The behavior learning unit 29 operates correspondingly.
[0078]
First, each capability will be described.
(Behavior search ability)
The behavior search ability is executed by the behavior search unit 23 described above, the reliability learning 25 and the non-target behavior learning unit 26 described later.
[0079]
A robot that encounters a situation Jic is applicable in that situation (situation adaptability A is greater than or equal to a predetermined threshold) and can expect a situation improvement effect with less effort (situation improvement expectation degree Ep is greater than or equal to a predetermined threshold) If no association information) is stored in the association database unit 22, the behavior retrieval unit 23 cannot select the solution association information. This is because the relation database unit 22 has a low possibility of improving the situation with little effort even if it is applicable in the situation Jic (the situation improvement expectation Ep is less than the predetermined threshold), or is not applicable in the situation Jic (the situation This is because only the behavior is stored. Therefore, only in such a case, the behavior search unit 23 selects one piece of association information as a (provisional) solution association information from the association database unit 22 using a random number.
[0080]
The selected linkage information R = [Ji, Ac, Jd] is applicable in the situation Jic (the situation suitability A (Jic, R) is greater than or equal to a predetermined threshold), and the situation Jdc after the action Ac is executed is If the target situation Jd is sufficiently similar (transition achievement degree B (Jdc, R) is equal to or greater than a predetermined threshold), the transition probability S (R) is increased. On the other hand, although the selected linkage information R is applicable, the situation Jdc after the execution of the action Ac is not similar to the planned target situation Jd (transition achievement degree B (Jdc, R) is In the case of less than a predetermined threshold), the transition probability S (R) is decreased and, at the same time, new association information (non-target behavior association information) R1 = [Jic, Ac, Jdc], and the transition probability information Si (R1) = [Ns (R1), Nt (R1), S (R1)] is represented as [1,1] , 1] and storing these R1 and S (R1) in the association database unit 22 to knowledge the transition (Jic + Ac → Jdc).
[0081]
In addition, when the selected linkage information R = [Ji, Ac, Jd] is not applicable in the situation Jic (the situation suitability A (Jic, R) is less than the predetermined threshold), the initial situation Ji is originally the actual situation Because it is not similar to Jic, it does not change the transition probability S (R), which is a measure of the correctness of this linkage information R, and new linkage information that represents the actual transition (Jic + Ac → Jdc) Action-related information) R1 = [Jic, Ac, Jdc] is generated, and the transition probability information Si (R1) = [Ns (R1), Nt (R1), S (R1)] is once in one trial. By setting it to [1,1,1] indicating success, and storing these R1 and S (R1) in the association database unit 22, only knowledge of this transition is performed.
[0082]
In this way, by selecting one linkage information R from the linkage information that has a low degree of expectation of situation improvement or cannot be applied, and whose effect is in danger, and confirming the result, the selected linkage information R Change transition probability S (R) (by reliability learning unit 25 described later), or generate new linkage information (non-target behavior linkage information) R1 for knowledge of actual transitions (described later) For example, the robot can know a new aspect of the action Ac by the non-target action learning unit 26). Then, when applicable association information is tried, the association information R whose transition probability S (R) is increased as a result is preferentially selected in a situation similar to the situation Jic, and the transition probability S ( Linkage information R with reduced R) becomes increasingly difficult to select in situations similar to situation Jic. That is, association information that is established under a certain situation (in which the transition probability S is increased) and association information that is not established (in which the transition probability S is decreased) are clarified. In addition, as a result of executing the appropriately selected association information R regardless of whether it is applicable or not, new association information (non-target behavior association information) R1 established under the circumstances is clarified. That is, knowledge about what kind of situation is brought about by action is accumulated in the relational database 22 in the form of relational information, both of which can improve the situation (success example) and which cannot be improved (failure example). Go.
[0083]
The behavior search capability described above is particularly exerted at the initial stage when the robot starts to move, and when the transition probabilities S of all applicable association information are still small. The same applies to the case where the initial situation described in the association information is not frequently generated and sufficient trials have not been made even if the usage period is extended. The same applies to the case where the environment around the robot has changed drastically, such as when the place of use and the user are changed, so that much of the association information held by the robot becomes inapplicable or cannot be established. Conventional robots with fixed behaviors that can be selected in specific situations cannot cope with such dramatic environmental changes.
[0084]
This behavior search ability works as follows. For example, consider a situation in which a robot beaten by a user tries to escape from the user but is beaten by being chased further. It is assumed that only the following linkage information R1 having “run away” in the action information Ac1 is stored in the linkage database unit 22 as the linkage information applicable in the situation Jic that the robot is beaten.
[0085]
Figure 0003854061
Naturally, the robot executes this linkage information R1, but by being chased by the user, the situation “did not run out” Jd2 suggested by this linkage information R1 does not lead to this linkage information R1 being useless here Be informed. Then, the transition establishment S (R) of the association information R1 decreases, and the transition probability S (R) of the association information R1 becomes extremely small as this is repeated several times, and the situation improvement expectation Ep (R ) Falls below a predetermined threshold value, this association information R1 can no longer be executed. Of course, at this time, the robot does not have any other powerful association information, so nothing can be executed. Therefore, the robot will try other association information by the behavior search ability. Probably after some wasteful uplifting, the robot happens to execute the following linkage information R2 having “Dancing” selected in a completely different initial situation “joyful” in the action information Ac2.
[0086]
Figure 0003854061
The initial situation Ji1 and Ji2 of R1 and R2 are completely different. The “dancing” action Ac2 is an action that is never selected in a “beaten” situation. However, suppose that as a result of the robot “being danced” by the ability to search for behavior, the user has been tempered and stopped pursuing. As a result, the robot knows for the first time by actually experiencing that it becomes a “cannot be beaten” situation by executing the action “dancing” in the initial situation of being “struck by the user”. This experience is added to the association database unit 22 as new linkage information (non-target behavior linkage information) R3 shown below, and affects future robot behavior.
[0087]
Figure 0003854061
Here, it is assumed that the signals detected by the various sensors are stored in the memory 17 in advance. For example, when the user hits the head of the robot, the robot recognizes that the pressure sensor of the robot head detects a force larger than a predetermined value for a shorter time than the predetermined time. Yelling at the robot is recognized by the robot as a state where a voice larger than a predetermined value is detected by the microphone of the robot.
[0088]
As can be seen from this example, the actions that the robot can try are limited to the actions stored in the association database unit 22 as the association information, and actions that deviate from the actions cannot be executed. The action search ability is an experience ability to know a new effect of a known action.
(Ability to replicate behavior)
The behavior search capability allows the robot to discover new effects of known behavior (eg, “dancing”), that is, unpredictable transitions from the transitions that actually occurred. As a result, although the robot cannot increase the content of the action itself, it can increase the knowledge for using the action. However, the robot still cannot discover new behavior.
[0089]
On the other hand, the behavior duplication ability executed by the other person behavior learning unit 27 described later is that the robot observes unknown behaviors performed by others around him and says, "This way you can do this in this situation." By acquiring information and storing it in the association database unit 22 as new association information (other party behavior association information) R, there is a capability of imitating behavior to acquire new behavior of oneself.
[0090]
For example, when user X was crying, another user Y touched or hugged the back of this crying user X, and the crying user X showed a crying smile Is observed by the robot.
[0091]
The robot detects this series of movements with an imaging camera and microphone, and the behavior that user X “crying” Ji is “sucking back” or “embracing” by user Y Recognize that a transition to the situation Jd “shows crying and smiles” is made by Ac. It is assumed that facial expressions such as a crying expression, a crying / non-crying expression, and a smiling expression are stored in the memory 17 in advance and can be recognized by the robot. Also, point to the back (behavior piece: contact the forelimb with the subject + action piece: slide the forelimb), and hold it (behavior piece: hold the subject with both forelimbs + action piece: leave for a while) Such an action can also be recognized as a chain of action segments stored in the memory 17 in advance.
[0092]
Therefore, in order for the robot to bring the initial situation Ji that someone “crying” into the target situation Jd that “stops crying” or “shows a smile”, the “crying” or “ Knowing what can be achieved with the action Ac "Hug", these Ji, Ac, Jd are put together as a new set of linkage information (other party behavior linkage information) R = [Ji, Ac, Jd]. R is added to the association database unit 22 to increase the action itself.
[0093]
The behavior that the robot can duplicate by imitation in this way is limited to the behavior that the robot can execute as a combination of behavior elements stored in the memory 17, and the behavior that deviates from it is duplicated I can't. The behavior duplication ability is an experience ability to know a new effect of a behavior consisting of a known or new combination of known behavior pieces by observing the behavior of others.
(Status adjustment ability)
When there are two different linkage information R1 = [Ji1, Ac1, Jd] and R2 = [Ji2, Ac2, Jd] starting from different initial situations Ji1 and Ji2 while aiming for the same situation Jd Due to the difference between the situation Ji1 and Ji2 and the difference between the actions Ac1 and Ac2, the transition probability S (R1) of R1 is high and the transition probability S (R2) of R2 is low. In other words, it is easy to reach Jd from Ji1, but it is rare to reach Jd from Ji2.
[0094]
The situation adjustment ability executed by the situation adjustment behavior learning unit 28, which will be described later, is a new association information (the situation Ji2 in which the transition is difficult to succeed is the initial situation and the situation Ji1 in which the transition is easy to succeed is the target situation) (Situation adjustment behavior association information) R3 = [Ji2, Ac3, Ji1] is generated and added to the association database unit 22, and it is the ability to acquire auxiliary preparatory behavior that facilitates Ji2 to Jd.
[0095]
Instead of trying to make a direct transition from Ji2 to Jd (Ji2 + Ac2 → Jd) by the linkage information R2 = [Ji2, Ac2, Jd], which is likely to fail, the situation adjustment behavior linkage information R3 = [Ji2, Ac3 , Ji1] leads to a situation where Ji2 tends to fail to a situation where Ji1 is likely to succeed, and then transitions from Ji1 to the final target Jd with relation information R1 = [Ji1, Ac1, Jd] (Ji2 + Ac3 → Ji1 + Ac1 → The robot learns the behavior pattern of Jd). At this time, the situation adjustment action linkage information R3 removes the condition (failure factor) peculiar to the situation Ji2 that is likely to fail transition, realizes the condition (success factor) peculiar to the situation Ji1 that is easy to succeed, and the linkage information R1 This is association information that represents a preparation action for preparing a transition. If the preparatory action is successful, the situation Ji1 that includes the success factor but not the failure factor is realized, and therefore, the possibility that the transition to the target situation Jd is successful is increased.
[0096]
For example, assume that there are the following two pieces of association information R1 and R2.
[0097]
Figure 0003854061
At this time, it is assumed that the transition probability S (R1) of the association information R1 is greater than or equal to a predetermined value and is greater than the transition probability S (R2) of the association information R2. This is because it is easier to find the user on the top of the sofa than on the back of the sofa, and the difference in the transition probabilities S tells that. The failure factor is behind the sofa and the success factor is on the sofa. At this time, the robot generates the following new linkage information (situation adjustment behavior linkage information) R3 from the situation Ji2 to the situation Ji1. Note that this transition probability information Si (R3) = [Ns (R3), Nt (R3), S (R3)] for R3 is set to [0, 0, 0] because this transition has not been attempted.
[0098]
Figure 0003854061
In this example, since the pleasant emotion strength C of the robot does not increase, the situation improvement effect E of this transition is zero. As described above, the situation adjustment ability adds the preparatory action R3 to the robot action pattern regardless of the superiority or inferiority of the situation improvement effect E. At the beginning of generation of the preparatory action R3 that the situation improvement expectation Ep (R3) is insufficient (the transition probability S (R3) is insufficient), R3 is selected by the action search ability. In particular, R2 is useless, so it is likely that R3 that matches the same initial situation is tried.
[0099]
In this way, two pieces of association information with different initial situations are stored in the association database 22 while reaching the same objective situation, and one transition probability is sufficiently high, and the other transition probability is sufficiently low. A function for generating new linkage information (situation adjustment behavior linkage information) for adjusting the situation is the situation adjustment capability.
[0100]
The actions that the robot can acquire as the preparatory action in this way are limited to actions that the robot can execute as a combination of action pieces stored in the memory 17, and the robot can be a success factor or a failure factor. However, if there is a condition that cannot be controlled, for example, the presence of a third party or its behavior, it is not possible to generate a behavior that calls for or excludes this. Despite the above-mentioned restrictions, the situation adjustment ability functions as an experience ability for the robot to know the preparatory action for preparing the conditions for making a certain action successful.
(Action planning ability)
The action planning ability executed by the chain action learning unit 29 to be described later is linked information (behavior in which one objective situation is almost the same as the other initial situation) continuously connecting the situations from the linkage database unit 22. ), And if such a chain can improve the situation, it is the ability to generate new linkage information (chain behavior linkage information) representing this linkage and add it to the linkage database unit 22.
[0101]
The purpose situation Jd1 of the association information R1 = [Ji1, Ac1, Jd1] and the initial situation Ji2 of the association information R2 = [Ji2, Ac2, Jd2] are almost the same (the situation similarity Sj (Jd1, Ji2) is greater than or equal to a predetermined threshold ), For example, the initial status Ji3 of R3 is almost the same as the target status Jd2 of R2, and the target status Jd3 of R3 is almost the same as the initial status Jd4 of R4. If it is found that the chain is linked to Rn, Rk precedes the value of pleasant emotion strength C (Jik) in the initial situation Jik of the linkage information Rk (1 ≦ k <n) at the beginning or middle of the chain When the value of the pleasant emotion strength C (Jdp) in the target situation Jdp of the linked linkage information Rp (k <p ≦ n) is larger, the transition that continuously executes the linkage information Rk,..., Rp (Jik + Ack +… + Acp → Jdp) means that the situation can be improved. Therefore, the robot generates new linkage information (chain behavior linkage information) Rx = [Jik, Ack +... + Acp, Jdp] in which Rk,..., Rp are linked, and adds them to the linkage database unit 22. As a result, the robot action patterns that can improve the situation are expanded. At this time, the transition probability S (Rx) of the chain action association information Rx is given by the product of the transition probabilities of the chained association information Rk,..., Rp. It should be noted that a chain that can improve the situation, which is composed of a plurality of pieces of linkage information, is all extracted from the linkages R1,..., Rn and added to the linkage database unit 22.
[0102]
For example, R3 acquired by the situation adjustment ability described above is more easily selected by the action planning ability. In this example, R1 and R2 below were compared, and R3 was generated as a preparatory action. However, R3 has no effect of improving the situation and is likely to be executed very rarely.
[0103]
Figure 0003854061
The action planning ability can generate new linkage information (chain behavior linkage information) R4 = [Ji2, Ac3 + Ac1, Jd] shown below by combining R3 and R1. This chain action linkage information R4 clearly has a situation improving effect, and if the transition probability increases after several trials, it is highly likely that it will be selected as solution linkage information by the normal operation of the action search unit 23 thereafter. .
[0104]
Figure 0003854061
As is clear from the above, the number of pieces of association information linked by the action planning ability may be any number, and the situation may be deteriorated on the way. In short, the value of the pleasant emotion strength C (Jdp) in the target situation Jdp of the last linkage information Rp is more than the value of the pleasant emotion strength C (Jik) in the initial situation Jik of the first linkage information Rk to be chained. What is necessary is just to be able to extract the large part from the chain.
[0105]
The association database unit 22 may store a plurality of pieces of association information describing transitions in which the initial situations are almost the same and the target situations are almost the same. Absent. In this case, the normal processing of the behavior search unit 23 preferentially selects the one with the smaller number of included behavioral segments, that is, the one with the higher execution ease W. Of course, if the transition probability S decreases as a result of the execution, a complex action with more action pieces will appear instead. To that end, it is important to create a lot of association information even if it seems to be useless at that time.
[0106]
In addition, there is a case where chain action relation information is found in which the initial situation of the chain and the target situation are almost the same (in a loop), but as described above, a chain that does not improve the situation is not generated. Correlation information with the same target situation is not generated.
[0107]
The reliability learning unit 25, the non-target behavior learning unit 26, the other person behavior learning unit 27, the situation adjustment behavior learning unit 28, and the chain behavior learning unit 29 that operate corresponding to each of the four abilities described above will be described in detail.
[0108]
(B) Reliability learning unit 25
The reliability learning unit 25 evaluates the result of the action performed by the robot and performs an operation to increase or decrease the transition probability of the association information describing the action. That is, the reliability learning unit 25 is one of means for realizing the behavior search capability described above.
[0109]
The reliability learning unit 25 selects the association information R = [Ji, Ac, Jd] in the situation Jic, and when the action Ac is completed and the situation Jdc is reached, the target stored in the association information R is stored. The situation similarity Sj (Jdc, Jd) between the situation Jd and the actual situation Jdc after completion, that is, the transition achievement degree B (Jdc, R) is obtained. R is established), the transition probability information Si (R) = [Ns (R), Nt (R), S (R)] of this linkage information R and the number of executions Nt (R) and the number of successes Ns (R ) Are increased by 1, and S (R) = Ns (R) / Nt (R) is stored in the memory 17 as a new transition probability value.
[0110]
Conversely, if the transition achievement degree B (Jdc, R) is less than the predetermined threshold, the transition has failed (the association information R has not been established), and the transition probability information Si (R) = [ Ns (R), Nt (R), S (R)] is incremented only by 1, and S (R) = Ns (R) / Nt (R) is set as the new transition probability value. Store in the memory 17.
[0111]
After the transition probability is updated (learned), when the robot selects association information applicable in the same situation as the situation Jic described above, there is a relationship with the situation improvement effect E, but the transition probability is higher than before. Linkage information R with a high S is easily selected. Conversely, the association information R with a reduced transition probability S becomes difficult to select, and as a result, does not appear as an action.
[0112]
Accordingly, the robot selects the association information with a high transition probability little by little by selecting the association information and performing an action and updating the transition probability S according to the success or failure of the transition.
[0113]
It should be noted that the reliability learning unit 25 does not increase the pleasant emotion strength C but evaluates the behavior based on whether or not the association information is correct. This is different from reinforcement learning performed by conventional robots. When the behavior of the robot is an increase in the pleasant emotion strength C, the reinforcement learning increases or decreases the frequency of the behavior depending on the magnitude of the pleasant emotion strength C (referred to as a reward signal) actually experienced after the transition. Reinforcement learning is a method of R = [Ji, Ac], which knows only the action Ac, the initial situation Ji to select it, and the action occurrence frequency S, and evaluates the target situation Jd before the action. I do not.
[0114]
Therefore, in reinforcement learning, even if the transition according to the linkage information does not occur, if the transition to the situation where the pleasant emotion intensity C happens to increase, the frequency of occurrence is increased even if it is an unplanned transition. End up. As a result, in practice, the behavior that makes the transition to the wrong situation will be strengthened in spite of the mistake.
[0115]
On the other hand, the present invention similarly causes the robot to act for the purpose of increasing the pleasant emotion strength C (this mechanism is handled by the behavior retrieval unit 23), but the behavior to be shifted really produces the result. Whether or not the transition probability S of the association information is increased or decreased. As a result, it becomes possible to select the action after grasping the correctness of the association information itself, so that the detailed situation can be controlled by the action. According to the present invention, as long as there is correct association information R = [Ji, Ac, Jd], the robot can create the targeted situation Jd. In comparison, reinforcement learning is like throwing a stone with your eyes closed.
[0116]
(B) Off-target behavior learning section 26
The off-target behavior learning unit 26 evaluates the result of the action performed by the robot, and when the linkage information describing the behavior is wrong, new linkage information (non-target behavior linkage information) representing the correct transition is obtained. An operation of generating and adding to the association database unit 22 is performed. That is, the non-target behavior learning unit 26 is one of means for realizing the behavior search capability described above.
[0117]
The off-target behavior learning unit 26 stores the association information R when the robot selects the association information R = [Ji, Ac, Jd] in the situation Jic and the action Ac is completed to the situation Jdc. The situation similarity Sj (Jdc, J2) between the target situation Jd and the actual situation Jdc after completion, that is, the transition achievement degree B (Jdc, R) is obtained. Information R was not established), and new association information (non-target behavior association information) R1 = [Jic, Ac, Jdc] representing the actual transition (Jic + Ac → Jdc) was generated, and the association database Add to part 22. Note that if the association information similar to the generated non-target behavior association information R1 is already stored in the association database unit 22, it is not added. This is to prevent the association database unit 22 from being punctured by a lot of similar association information.
[0118]
Whether or not the association information similar to the generated non-target behavior association information R1 is already stored in the association database unit 22 is determined by performing the following search.
[0119]
First, the status transition action Ac in the newly added linkage information R1 = [Jic, Ac, Jdc] and the status in each linkage information Rn = [Jin, Acn, Jdn] stored in the linkage database unit 22 The transition behavior Acn is compared, and the association information Rn in which both are the same is sequentially detected. This is to detect only the association information having the same action as the action Ac of the association information R1 to be added.
[0120]
Next, the situation between the initial situations of the situation Jic, Jdc in the linkage information R1 = [Jic, Ac, Jdc] and the situation Jin, Jdn in the detected linkage information Rn = [Jin, Acn, Jdn] When the similarity Sj (Jic, Jin) and the situational similarity Sj (Jdc, Jdn) between the target situations are obtained, and both of the similarities both obtain a predetermined threshold value or more, the action is the same as the association information R1 to be added Thus, it is determined that there is already association information that is sufficiently similar in both the initial situation and the objective situation, and the addition of the association information R1 to the association database unit 22 is canceled.
[0121]
Here, the difference between the present invention and conventional reinforcement learning will be described.
[0122]
In conventional reinforcement learning, the frequency of action occurrence is adjusted depending on the success or failure of the action of the robot that executed the selected action pattern (increase or decrease in pleasant emotion intensity C). In other words, as a result of the action, the transition that actually occurred was evaluated only by the pleasant emotion intensity C (reward signal), and only the expression frequency was learned.
[0123]
On the other hand, the non-target behavior learning unit 26 of the present invention can learn the transition (Jic + Ac → Jdc) that has actually occurred as added association information R1 = [Jic, Ac, Jdc]. That is, the initial situation Jic in which the action Ac is expressed and the target situation Jdc to be visited as a result can be made into knowledge in reality.
[0124]
Both the present invention and the conventional reinforcement learning are the same in that they increase the frequency of occurrence of actions with a high effect of improving the situation and decrease the frequency of occurrence of a low effect of improvement, but in reinforcement learning, the actual initial situation is changed. Since learning is not performed, `` At this time (Ji) '' in the knowledge that `` At this time (Ji) should do this action (Ac) '' is fixed, and the knowledge of that fixed knowledge Originally, the fact that it is easier to get a reward at this time is acquired by learning the expression frequency S. That is, R = [Ji, Ac] is fixed and never learned. Moreover, since the objective situation Jd is not made into knowledge, it is not possible to learn behavior patterns that deal with subtle discrepancies in the situation.
[0125]
On the other hand, the present invention is different from reinforcement learning in that it can learn action patterns that deal with subtle differences in the situation. This is necessary in order to build a robot that can accumulate and operate knowledge about what kind of situation the action creates. When the knowledge is established (transition according to the association information occurs), no problem occurs even if this knowledge is continuously applied. On the other hand, when knowledge has not been established (transition according to the association information has not occurred), it is necessary to newly construct a knowledge that can be established different from this knowledge. The failure may be due to subtle differences in the initial situation, or may be due to uncertainties that could not be observed as situation information. Therefore, in such a case, by constructing additional knowledge including the situation before and after the non-target behavioral studies main part 26, the present invention can demonstrate the situation adaptability beyond the reinforcement learning (does not make the situation knowledge). It becomes like this.
[0126]
In this way, in addition to the reliability learning unit 25 learning the ease of transition to the targeted posterior situation, the non-target behavior learning unit indicates that there is a transition to a situation different from the targeted posterior situation. 26 learn. Unlike reinforcement learning, this mechanism that can be applied and accumulated (as relational information) can be applied to a system that has higher learning adaptability than before.
[0127]
The non-target behavior learning unit 26 is to knowledge a new initial situation where a known behavior can be applied and a new target situation where a known behavior can be transitioned. . As a result, the system will be able to apply known actions with the expectation of a new effect, that is, acquire a new action pattern (which can do this action), but increase the number of known actions. It is not possible. That is, the non-target behavior learning unit 26 operates so as to expand the situation information in the association information. In other words, the learning performed here does not acquire new behavior information.
[0128]
The robot can exhibit the above-described “behavior search ability” by cooperation of the behavior search unit 23, the reliability learning unit 25, and the non-target behavior learning unit 26. In other words, even if the robot does not memorize an action having a sufficient situation improvement effect, it is possible to try some action by the action of the action search unit 23. Such trials are accumulated as knowledge that influences future actions regardless of the success or failure of the situation improvement through the functions of the reliability learning unit 25 and the non-target behavior learning unit 26.
[0129]
In particular, when the transition according to the linkage information is not performed, new linkage information is constructed, so even if a situation different from the knowledge is reached, it is converted into knowledge as new linkage information, and this robot's Situational adaptability is improved.
[0130]
In order for the robot to exhibit the behavior search capability as described above, it is necessary to first store several types of behavior patterns (association information) in the association database unit 22. The more the stored action patterns are enriched (the more the number is), the more situations the robot can or can cope with.
[0131]
However, if the situation does not improve no matter what action is taken, this robot will continue to useless actions endlessly. This is the limit of the situational ability of robots that do not have the ability to expand the behavior itself. In order for the robot to demonstrate further ability to cope with situations, a learning function that increases the situation transition behavior itself is necessary.
[0132]
(C) Others Behavior Learning Department 27
The other person behavior learning unit 27 stores the behavior performed by another person such as a user in the association database unit 22 as new association information (other person behavior association information), and operates as one of the behavior patterns of the robot. . In other words, the other person behavior learning unit 27 is a means for realizing the behavior replication capability described above.
[0133]
More specifically, the situation input unit 21 recognizes the voice, action (attitude), facial expression, etc. of the other person with a microphone or imaging camera provided on the robot, and determines how the other person's situation was before and after this action. presume. The situation of others includes internal state parameters such as emotions that require estimation, in addition to external state parameters that can be detected immediately by observation. The estimation of the internal state parameters is performed based on the voice, behavior (attitude), and facial expression of the other person input, and dictionary information for recognizing them is stored in the memory 17 in advance. The contents of this dictionary information are information used to detect facial expressions, behaviors such as gestures (gestures), speech vocabulary, etc. from captured images and captured voices, and to identify internal state parameters that can be read from them. It is. As a result, if, for example, it is observed that an angry facial expression image changes from a angry facial expression image to a laughing facial expression image, it is estimated that the emotional state of the other person has changed from anger to joy. The estimated result is stored in the situation information sequence.
[0134]
When the other person action learning unit 27 detects the action Ac of the other person in the situation information sequence by the situation input unit 21, the other person action learning unit 27 operates in the following two cases.
[0135]
(1) When action Ac is performed on a robot
Normally, the situation input unit 21 treats the emotional state and behavior of others as an external state of the robot, and the emotional state and behavior of the robot are collected in the situation information as the internal state of the robot. Since the action Ac was performed by another person for the robot, if the relationship between them is turned upside down, it should be able to be reinterpreted as a robot action for the other person.
[0136]
The external state parameters observed as the robot's surroundings can be broken down into two parts: (a) the part related to the other person acting as an actor, and (b) the environmental part excluding the other person. (a) is the facial expression, behavior, and attitude of the other person acting as an actor, and the emotions and desires of the other person that the robot could infer from them. Further, (b) is an environment part common to both the robot and others, such as surrounding trees and objects. The robot internal state parameters are (c) internal state parameters representing the emotions and desires of the robot.
[0137]
At this time, in addition to the above (b) and (c), the external state parameter viewed from the other party is actually a robot, but from the symbol data replaced as if there is some other party. Synthesized. The internal state parameter of the other person is the above (a).
[0138]
Therefore, the other person behavior learning unit 27 decomposes each of the situation information strings Ji and Jd indicating the situation before and after the action Ac into the above (a), (b), and (c) and reorganizes the action information. New linkage information (others), where Ji 'and Jd' are the other person situation information sequences that capture the situation before and after Ac from the perspective of others, Ji 'is the initial situation, Jd' is the target situation, and Ac is the situation transition action Person behavior association information) R = [Ji ′, Ac, Jd ′] is generated and added to the association database unit 22. Note that if the association information similar to the generated other person behavior association information R is already stored in the association database unit 22, it is not added. Note that the search for whether or not the association information similar to the other person behavior association information R exists in the association database unit 22 is the same as the search performed by the non-target behavior learning unit 26.
[0139]
(2) When action Ac is performed between others
The situation input unit 21 treats the emotional states and behaviors of the other person X and the other person Y as an external state of the robot and collects them in situation information. Assuming that the action Ac is performed by the other person Y for the other person X, the robot's external state parameters are (a) the part related to the other person Y who is the actor, and (b) the other person who is the target person. It can be broken down into three parts: a part related to X and (c) an environmental part excluding the part related to others X and Y. (a) is the expression, action, and attitude of the actor Y, and the emotion and desire of the actor Y that can be estimated by the robot. (b) is the facial expression, action, and attitude of the subject X, and the emotion and desire of the subject X that can be estimated by the robot. Further, (c) is an environment part common to both others X and Y, such as surrounding trees and objects.
[0140]
At this time, in addition to the above (b) and (c), the external state parameter viewed from the actor Y is actually the target person X, but this was replaced as if there was some other person Synthesized from symbol data. Also, the internal state parameter of the actor Y is (a).
[0141]
Therefore, the other person behavior learning unit 27 decomposes each of the situation information strings Ji and Jd indicating the situation before and after the action Ac into the above (a), (b), and (c) and reorganizes the action information. New linkage information (others), where Ji 'and Jd' are the other person situation information sequences that capture the situation before and after Ac from the perspective of others, Ji 'is the initial situation, Jd' is the target situation, and Ac is the situation transition action Person behavior association information) R = [Ji ′, Ac, Jd ′] is generated and added to the association database unit 22. Note that if the association information similar to the generated other person behavior association information R is already stored in the association database unit 22, it is not added. Note that the search for whether or not the association information similar to the other person behavior association information R exists in the association database unit 22 is the same as the search performed by the non-target behavior learning unit 26.
[0142]
Note that if the association information similar to the generated other person behavior association information R is already stored in the association database unit 22, it is not added. Note that the search for whether or not the association information similar to the other person behavior association information R exists in the association database unit 22 is the same as the search performed by the non-target behavior learning unit 26.
[0143]
The other person behavior learning unit 27 allows the robot to exhibit “ability to learn from others”, that is, “behavior replication capability”.
[0144]
For example, when user Y points to the back of user X who is crying, by observing the site where user X who was crying showed crying and a smile, robot was such an interpersonal of user Y Can learn behavior. Then, this learned behavior is manifested at another opportunity when a crying user Z is detected.
[0145]
At this time, in order to select such an interpersonal action, the action needs to increase the pleasant emotion strength C of the robot. This is related to the affectionate feelings of robots towards others.
[0146]
For example, when a robot has a good feeling for a certain person, the situation of the person is detected by the situation input unit 21 and acts to impair the pleasant emotion strength C of the robot. For this reason, the robot is required to take action to restore the person's plight in order to improve his / her pleasant emotion strength C, and as a result, the interpersonal action that has been effective in improving the situation of the other person learned earlier appears.
[0147]
Conversely, when a robot is not likable to a person, the person's plight does not impair or increase the pleasant emotion strength C of the robot, so the behavior to restore the opponent's poverty does not appear, Or, behavior that further increases the plight appears.
[0148]
The feelings of admiration for others are formed through the previous relationship between robots and others. For a person who loves a robot, a label (information) “this person is a good person” is added in dictionary information for detecting the person. Conversely, a person who bullies the robot is labeled “This person is a bad person” in the dictionary information for detecting the person. Each time a person is detected, it is determined whether the person is good or bad, and the influence of the observed external state on the emotional state of the robot changes according to the result. These processes are performed by the status input unit 21.
[0149]
As described above, in the present invention, the other person behavior learning unit 27 contributes to causing the robot to acquire interpersonal behavior by imitating other people's behavior, and the situation input unit 21 detects whether the other person is good or bad. Based on the above, the pleasant emotion strength C of the robot is changed, and the behavior search unit 23 expresses the interpersonal behavior learned based on the pleasant emotion strength C.
[0150]
With the configuration described so far, the robot can exhibit “behavior search ability” and “behavior replication ability”. Specifically, (I) Adaptation of behavioral frequency, (II) New acquisition of initial status as behavioral expression conditions, (III) New acquisition of target status as behavioral effect, (IIII) Content of behavior New acquisition of the situation transition behavior itself becomes possible. In particular, (II) to (IIII) are knowledge that cannot be obtained by a conventional robot.
[0151]
However, with such abilities alone, robots can only act while being constrained by the effect of improving the situation of individual actions, so the situation is finally improved by combining multiple actions while deteriorating the situation once. There is a possibility that the plan to reach it cannot be demonstrated. With respect to this point, the situation adjustment behavior learning unit 28 and the chain behavior learning unit 29 described below can correspond to each other, so that the robot can behave with a plan.
[0152]
(D) Situation Control Behavior Learning Department 28
When the situation adjustment behavior learning unit 28 cannot make a transition from a certain initial situation to a certain target situation, in order to be able to apply other association information that has been able to make a transition from the other initial situation to the target situation, The transition for creating the information is stored in the association database unit 22 as new association information (situation adjustment behavior association information), and the robot acts as one of the behavior patterns of the robot. That is, the situation adjustment behavior learning unit 28 is means for realizing the above-described situation adjustment ability.
[0153]
The situation adjustment behavior learning unit 28 is activated each time the association information is added to the association database unit 22, and has a goal situation Jd2 similar to the goal situation Jd1 of the added linkage information R1 = [Ji1, Ac1, Jd1]. The association database R22 is searched for the association information R2 = [Ji2, Ac2, Jd2] (the situation similarity Sj (Jd1, Jd2) is equal to or greater than a predetermined threshold). When the association information R2 is detected as a result of the search, the situation adjustment behavior learning unit 28 evaluates both transition probabilities S (R1) and S (R2), and the transition probability S (R1) of the association information R1 is predetermined. If there is a threshold or more and the transition probability S (R2) of the linkage information R2 is lower than the threshold by S (R1), new linkage information from the initial situation Ji2 of R2 to the initial situation Ji1 of R1 (situation adjustment behavior linkage information) An operation of generating R3 and storing it in the association database unit 22 is performed. Or, conversely, if the transition probability S (R2) of the association information R2 is greater than or equal to a predetermined threshold and the transition probability S (R1) of the association information R1 is lower than the predetermined threshold by more than S (R2), the initial situation Ji1 to R2 of R1 An operation for generating new linkage information (situation adjustment behavior linkage information) R3 leading to the initial situation Ji2 and storing it in the linkage database unit 22 is performed.
[0154]
Note that if the association information similar to the generated situation adjustment action association information R3 is already stored in the association database unit 22, it is not added. Further, the search for whether or not the association information similar to the situation adjustment behavior association information R3 exists in the association database unit 22 is the same as the search performed by the non-target behavior learning unit 26.
[0155]
More specifically, a plurality of (for example, two) pieces of association information R1 = [Ji1, Ac1, Jd] and R2 = [Ji2, Ac2, Jd] (one of which is added to one of them) with the same target situation Jd ), One association information R1 has a high frequency, and the other association information R2 has a low frequency. The reason that one side can reach the target situation Jd but the other cannot reach is due to the difference between the initial situation as the starting point and the action that can be performed at that time. Therefore, the initial conditions Ji1 and Ji2 of the association information R1 that succeeds in the transition and the association information R2 that does not succeed, the incidental condition Jk that is included in the two association information in common, and the incidental condition Js that is specific to the former (success), Separated into the incidental condition Jf peculiar to the latter (failure). This Js is a success factor and Jf is a failure factor. Ji1 = Jk + Js and Ji2 = Jk + Jf.
[0156]
The situation adjustment action is an action of changing the situation from the initial situation Ji2 = (Jk + Jf) to the target situation Ji1 = (Jk + Js).
[0157]
For example, consider the following two pieces of related information that have the same purpose situation.
[0158]
Figure 0003854061
At this time, "I am alone and lonely" is the common condition Jk, "I am happy to find the user" is the target situation, the success factor Js is "on the sofa", the failure factor Jf is "behind the sofa" It becomes. The process performed by the situation adjustment behavior learning unit 28 generates an action Ac3 that changes Jf to Js, specifically, an action “Climbing on the couch”, and new association information including this action Ac3 (situation adjustment action linkage). Information) R3 = [Ji2 = Jk + Jf, Ac3, Ji1 = Jk + Js].
[0159]
Figure 0003854061
In accordance with this new situation adjustment action linkage information R3, the robot performs an action of “climbing on the sofa when alone behind the sofa and lonely”. Note that the climbing of the robot must be stored in the memory 17 as an action segment of the robot. However, the robot does not have the action of climbing on the couch, and of course, the action pattern of “climbing on the couch when you are alone behind the couch” is also acquired for the first time.
[0160]
(E) Chain Behavior Learning Department 29
When the linkage information learning unit 29 cannot improve the situation with individual linkage information (behavior), it finds a linkage of linkage information that can improve the situation by continuously performing multiple linkage information (behavior) and describes the linkage New association information (chain behavior association information) is generated and stored in the association database unit 22, and is operated as one of the behavior patterns of the robot. That is, the chain behavior learning unit 29 is means for realizing the above-described behavior planning ability.
[0161]
The chain behavior learning unit 29 is activated each time new association information is added to the association database unit 22 by the actions of the non-target behavior learning unit 26, the other person behavior learning unit 27, and the situation adjustment behavior learning unit 28. Investigate the contents of the linkage information stored in the part 22, and the purpose status of one linkage information is similar to the initial status of the other linkage information, that is, three or more situations are consecutive in a chain of two or more actions R1 = [Ji1, Ac1, Jd1], R2 = [Ji2, Ac2, Jd2] (situation similarity Sj (Jd1, Ji2) is greater than or equal to a predetermined threshold), R3 = [Ji3, Ac3, Jd3 ] (Situation similarity Sj (Jd2, Ji3) is equal to or greater than a predetermined threshold)... All the chains of Rn = [Jin, Acn, Jdn] are searched (where n is a natural number of 4 or more). Here, the association information R1 is the first association information, R2 is the second association information, and R3 is the third association information. In this case, the linkage information is two-chained. A chain is a chain that is different if even one piece of association information that constitutes it is different, and a chain that is different if the order of the pieces of association information that is an element is different. This search is limited to a search for a chain in which the added association information is any one of the above R1 to Rn. If a chain is detected as a result of the search, the chain action learning unit 29 determines that, based on the pleasant emotion strength C (Jik) of the initial situation Jik of the association information Rk (1 ≦ k <n) in the extracted chain. Also, all the partial chains (including the chain itself) in which the pleasant emotion strength C (Jdp) of the target situation Jdp of the linkage information Rp (k <p ≦ n) is improved are extracted and each of them is newly associated information. (Chain behavior association information) Rx = [Jik, Ack +... + Acp, Jdp] is stored in the association database unit 22.
[0162]
Note that if the association information similar to the generated chain behavior association information Rx is already stored in the association database unit 22, it is not added. Further, the search for whether or not the association information similar to the chain behavior association information Rx exists in the association database unit 22 is the same as the search performed by the non-target behavior learning unit 26.
[0163]
Furthermore, it is possible to create and store new chain action association information from the chain action association information by the above-described procedure.
[0164]
Further, by the above processing, the association information R11 having the initial situation Ji11 similar to the purpose situation Jd10 of the certain association information R10, the association information R12 having the initial situation Ji12 similar to the purpose situation Jd11 of the association information R11, and this When there is association information R13 having an initial situation Ji13 similar to the objective situation Jd12 of the association information R12, the pleasant emotion strength C of the objective situations Jd11, Jd12 of R11, R12 is lower than the initial situation Ji10 of the association information R10 However, if the pleasant emotion strength C of the objective situation Jd13 of the linkage information R13 is large, the linkage information R10 to R13 is stored in the linkage database unit 22 as new chain action linkage information. In this case, the chain is 2 (n = 2), and the association information is 3 (n + 1).
[0165]
In this way, when multiple linkage information is combined to generate chain action linkage information, even if the halfway action is executed, the pleasantness intensity C will eventually increase even if the pleasantness intensity C decreases temporarily It should be good if you do.
[0166]
With this configuration, the robot exhibits the situation adjustment ability and the action planning ability. Specifically, not only actions that directly improve the situation, but also acquisition of preparatory actions that directly lead to improvement of the situation without directly improving the situation, and eventually worsening the situation along the way It is possible to generate and acquire related information describing a series of actions linked to situation improvement.
[0167]
As already mentioned, the situation adjustment behavior learning unit 28 and the chain behavior learning unit 29 monitor the update status of the linkage information stored in the linkage information database unit 22, and are activated when the system is started. It is activated every time the addition of new association information is detected. Also, it is activated again immediately after the association information is added by itself, and is recursively activated until no association information to be added can be found.
[0168]
The configuration as described above and the ability executed by each component have been described. Next, the behavior forming method will be described with reference to the flowchart of the behavior forming method in FIG. In the association database unit 22, it is assumed that, in addition to the individual association information, the situation adjustment behavior association information and the chain behavior association information are already stored at the time of robot operation. If not, the situation adjustment behavior learning unit 28 and the chain behavior learning unit 29 are activated at the stage before the robot operation, and the situation adjustment behavior linkage information and the linkage behavior linkage information about all the linkage information by its function. Shall be added.
[0169]
(1) The situation input unit 21 acquires situation information around the robot (S1). The situation information is detected by the distance sensor 11, the pressure sensor 14, the imaging camera 10, and the microphone 12, for example, the presence or absence of the detected object (user etc.), the expression or state of the detected object, the detected object, etc. It is a sound to be emitted and an action by a detected object. The detected situation information is edited into the situation information sequence obtained so far, and is output to each of the action expression loop, the learning loop 1, the learning loop 2, and the learning loop 3.
[0170]
First, the behavior expression loop will be described.
[0171]
(2) The behavior search unit 23 extracts association information (candidate association information) having an initial situation that matches the latest situation information string (current situation Jic) from the association database unit 22 stored in the memory 17 (S2 ). In this extraction, the situation suitability A of each piece of association information is calculated and evaluated, and only the association information that has acquired a predetermined threshold or more is extracted as candidate association information. At this time, score information Sc (R) including the situation improvement effect E, transition probability S, and ease of execution W of the candidate association information is also extracted. The extracted candidate association information is temporarily stored in the memory 17 together with the score information.
[0172]
(3) Next, the CPU 16 determines whether or not the association information (candidate association information) that matches the input status information Jic has been extracted (S3).
[0173]
If at least one candidate association information is extracted, the process proceeds to S4. If no candidate association information is extracted, one association information is randomly extracted from the association database unit 22 in order to perform a behavior search. Select as linkage information and go to S5.
[0174]
(4) When at least one candidate association information is extracted, solution association information is determined from each extracted candidate association information (S4).
[0175]
Situation improvement expectation degree Ep = situation improvement effect E × transition probability S × executability W of each candidate association information is calculated, and CPU 16 determines whether or not the value has a value equal to or greater than a predetermined threshold. As a result of the determination, the candidate association information whose expected situation improvement is less than the predetermined threshold is deleted from the temporary storage of the memory 17. Then, the remaining candidate association information having the highest situation improvement expectation is advanced to S5 as solution association information. If there is no remaining candidate association information, one association information is randomly selected as solution association information from the association database unit 22 to perform a behavior search, and the process proceeds to S5.
[0176]
(5) Next, the CPU 16 outputs the action element information described in the action information to the action output unit 24 in accordance with the timing information described in the action information of the solution association information (S5).
[0177]
The behavior output unit 24 starts the operation according to the received behavior segment information. The operation means that the robot is driven. For example, the LED (9) blinks, a sound is emitted from the speaker 13, or the robot 1 itself moves or deforms.
[0178]
After the solution association information is executed, the process returns to S1.
[0179]
Next, the learning loop 1 (reliability learning unit 25, non-target behavior learning unit 26) will be described.
[0180]
(6) First, the CPU 16 determines whether or not an operation is being performed according to the solution association information output from the behavior search unit 23 to the behavior output unit 24 (S6).
[0181]
If yes, go to S7, otherwise return to S1. When returning to S1, the robot is not performing any action.
[0182]
(7) If the robot is operating, the CPU 16 determines whether or not the operation according to the solution association information has ended (S7).
[0183]
If completed, the process proceeds to S8, and if not completed, the process returns to S1. When returning to S1, the robot is operating.
[0184]
(8) When the operation is complete, the CPU 16 calculates the transition achievement degree B (Jdc, Jd) between the target situation Jd described in the solution relation information and the actual situation Jdc after the operation. It is determined whether or not the situation Jd has been reached (S8). If the transition achievement degree B (Jdc, Jd) is greater than or equal to a predetermined threshold, the transition based on the selected solution association information is considered successful, and if it is less than the predetermined threshold, the content of the transition probability information Si is updated as appropriate. To go. By performing such an operation, reliability learning is performed on the solution association information.
[0185]
(9) Next, if it is determined that the failure has occurred in S8, the CPU 16 assumes that a transition has been made to a situation different from the objective situation of the solution association information, and the initial situation and the objective situation of the solution association information are actually The new association information (non-target behavior association information) replaced with the situation (including score information Sc) is generated by the CPU 16 (S9). The generated association information is stored if similar association information does not exist in the association database unit 22.
[0186]
Return to S1.
[0187]
Next, the learning loop 2 (other action learning unit 27) will be described.
[0188]
(10) First, the status input unit 21 detects whether or not the detected object (particularly the user) is performing any action (S10).
[0189]
If the behavior of the detected object can be detected, the process proceeds to S11, and if not detected, the process proceeds to S1. When proceeding to S1, either the detected object does not exist in the detection range, the detected object is not acting, or the detected object is acting but the robot cannot recognize this action State.
[0190]
(11) If it can be detected, the CPU 16 determines whether or not the action of the detected object has ended based on the status information sequence detected by the status input unit 21 (S11).
[0191]
If the action has ended, the process proceeds to S12. If the action has not ended, the process proceeds to S1. When the process proceeds to S1, the robot continues to detect the action of the detected object until the action of the detected object ends.
[0192]
(12) When the action is finished, the CPU 16 displays the initial situation Ji of the detected object, the situation transition action Ac performed subsequently, and the target situation Jd achieved by the situation transition action Ac. The information is extracted from the information string and edited as a set of association information (other-party behavior association information) (S12). The edited association information is stored if similar association information does not exist in the association database unit 22.
[0193]
The learning loop 2 allows the robot to capture the behavior of the detected object as its new motion pattern. Proceed to S1.
[0194]
Next, the learning loop 3 (situation adjustment behavior learning unit 28, chain behavior learning unit 29) will be described.
[0195]
(13) First, the CPU 16 checks whether or not there is newly added association information in the association database unit 22 (S13).
[0196]
If new association information exists, the process proceeds to S14, and if not, the process proceeds to S1.
[0197]
In order to detect new association information, the number of association information at the time of the previous detection is stored in the memory 17, and this number is compared with the number of association information at the time of detection this time. All indexes (identification symbols such as R0001) at the time of the previous detection are stored in the memory 17, and this link information and the index at the time of the current detection are compared one by one for determination. There is a way.
[0198]
(14) At the time of system start-up or when new linkage information has been added, new linkage information (situation adjustment behavior linkage information) based on the newly added linkage information by the situation adjustment behavior learning unit 28 Is generated and stored if the similar association information does not exist in the association database unit 22 (S14).
[0199]
(15) Next, the linkage behavior learning unit 29 generates new linkage information (chain behavior linkage information) based on the newly added linkage information, and similar linkage information exists in the linkage database unit 22. If not, it is memorized (S15). Proceed to S1.
[0200]
Through the processes (1) to (15), the behavior of the robot is formed / operated.
[0201]
Specifically, with the above-mentioned 1. Behavior Search Ability, when a robot does not know an effective behavior, it can try some known behaviors to discover and learn new effects, or 2. Behavior Duplication Ability to discover and learn the existence of new behaviors by observing the behavior of others, and 3.Situation adjustment capabilities to discover and learn behaviors that turn unaccountable situations into manageable situations 4. With the ability to plan for action, four learning processes, such as discovering and learning new effects of continuously executing multiple actions that have been known as separate actions, are performed almost in parallel. Increase the movement pattern.
[0202]
In the first embodiment as described above, the robot itself autonomously learns and increases the motion pattern and its utilization method over time, so that the user's interest is not diminished. Used. In addition, the actions performed by the robot become more and more precise and the user can realize that the robot is growing.
[0203]
In addition, unlike a conventional case, a substantially single operation is not performed for a specific input.
[0204]
In addition, it is not necessary for the user to input / store a new motion pattern, so that the operability can be improved and the robot can be made as close to a living organism as time passes.
[0205]
In addition, by learning a behavior pattern from a detected object, it is possible to learn a new behavior that exceeds the range of one's own behavior experience and use it as one of its own behavior patterns.
[0206]
In addition, since the success factors and failure factors of the behavior are extracted, and the association information that removes the failure factors and incorporates the success factors is formed, the situation can be dealt with with a higher success rate as the experience is gained.
[0207]
Further, by combining a plurality of action patterns into a series of action patterns, it becomes possible to reach a situation that cannot be achieved by individual actions.
[0208]
In addition, it is possible to provide a robot that can realize learning and growing ability in the behavioral aspect of the robot at a higher level than before, and is worth using (nurturing) the user and is more timeless.
[0209]
Next, the configuration of the second embodiment in which the simulated biological system according to the present invention is implemented by a robot will be described with reference to FIG.
[0210]
In the following embodiments, the same components are denoted by the same reference numerals, and redundant description is omitted.
[0211]
A feature of the second embodiment is a robot behavior formation method using a computer-readable storage medium storing a program for operating the robot.
[0212]
FIG. 5 is a block diagram for explaining the second embodiment, and a storage medium 60 stores a program for implementing the first embodiment.
[0213]
(1) The program in the storage medium 60 is read by the personal computer 61, which is an electronic device, and stored in the memory 62. The read program is transmitted to the robot 1 by wireless communication, and the program in the control unit 15 in the robot 1 Store in the memory 17.
[0214]
In this case, the personal computer 61 has an insertion unit 63 into which the storage medium 60 is inserted, a CPU 64 that handles read / store / calculation operations, a memory 62 that stores the read program, and a transmission that transmits the read program to the robot 1 A unit 65 and an input unit 66 such as a keyboard and a mouse are provided. Further, the robot 1 is provided with a receiving unit 67 for receiving the transmitted operation signal in a part of the exterior, and the operation signal received by the receiving unit 67 is stored in the memory 17 in the control unit 15 and starts operation.
[0215]
(2) It is also possible to insert a storage medium into the program reading unit 68 provided in the robot 1 and directly store the program in the memory 17 in the control unit 15 in the robot 1 for operation.
[0216]
As described above, after the program is stored in the memory 17 in the robot 1 by (1) and (2), the same operation as that of the above-described first embodiment is performed.
[0217]
In such a second embodiment, the type of program stored in the same robot can be changed. For example, an active robot program actively performs active operations such as running well If it is a program for robots which is performed in a simple manner, it becomes a robot that actively performs gestures and calls that are pleasing to the user, and a robot that the user likes can be realized. Therefore, it is only necessary to purchase one robot, and the user can obtain a plurality of pleasures by simply changing the type of program.
[0218]
Needless to say, the present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the spirit of the present invention. For example, a temperature sensor for measuring the temperature around the robot can be provided on the movable part or the main body of the robot. By doing so, the robot can handle the ambient temperature as an external situation.
[0219]
The storage medium in the present invention can store a computer program such as a magnetic disk, floppy disk, hard disk, optical disk (CD-ROM, CD-R, DVD, etc.), magneto-optical disk (MO, etc.), semiconductor memory, etc. As long as the computer-readable storage medium is used, the storage format and the type of physical medium may be any form.
[0220]
In addition, an OS (operation system) operating on the computer, database management software, MW (middleware) such as a network, and the like that are operating on the computer based on instructions from a computer program installed on the computer from the storage medium implement the present embodiment. A part of each process may be executed.
[0221]
Furthermore, the storage medium in the present invention is not limited to a medium independent of a computer, but a storage medium that stores or temporarily stores a computer program for the purpose of transmission over a LAN, the Internet, or the like, or a computer that is transmitted over a LAN, the Internet, or the like A storage medium in which the program is downloaded and stored or temporarily stored is also included.
[0222]
Further, the number of storage media is not limited to one, and the case where the processing in the present embodiment is executed from a plurality of media is also included in the storage medium in the present invention, and the configuration of the media may be any configuration.
[0223]
The computer according to the present invention executes each process according to the present embodiment based on a program stored in a storage medium, and a single device such as a personal computer or a plurality of devices are connected to a network. Any configuration such as a system may be used.
[0224]
In addition, the computer in the present invention is not limited to a personal computer, but includes an arithmetic processing device, a microcomputer, and the like included in an information processing device, and is a generic term for devices and devices that can realize the functions of the present invention by a program. .
[0225]
The action formation method is stored as a computer program.
[0226]
Further, in the pseudo-biological system according to the present invention, in addition to a robot as an entity, an anthropomorphic or pseudo-biotic character is animated by a technique such as CG (Computer Graphics) and is virtually displayed on a display screen of a computer or the like. It also includes software applications that instantiate. In this case, instead of controlling the motor of the robot (1) to move each joint to a desired angle, the action output unit (24) displays an animation in which each joint of the character is moved to a desired angle by coordinate transformation. Display on the screen. Since the system entity is not a robot but a computer or the like, the behavior forming method according to the present invention can be executed, although there are some restrictions on the situation information that can be obtained and the actions that can be performed compared to an actual robot. It is.
[0227]
The information input to the non-target behavior learning unit may be either situation information directly input from the situation input unit or information input from the reliability learning unit (unsuccessful association information). Absent.
[0228]
【The invention's effect】
According to the present invention as described above, the pseudo creature itself creates and adds a new motion pattern, thereby becoming a pseudo creature that does not get tired of the user.
[Brief description of the drawings]
FIG. 1 is a perspective view of a first embodiment in which a simulated organism according to the present invention is implemented by a robot.
FIG. 2 is a block diagram of a first embodiment in which a simulated organism according to the present invention is implemented by a robot.
FIG. 3 is a block diagram for explaining the operation of the first embodiment in which the simulated organism according to the present invention is implemented by a robot.
FIG. 4 is a flowchart for explaining a behavior forming method according to the first embodiment in which a simulated creature according to the present invention is implemented by a robot.
FIG. 5 is a block diagram for explaining a second embodiment in which a simulated organism according to the present invention is implemented by a robot.
[Explanation of symbols]
1 Robot
2 heads
3 Right arm
4 Left arm
5 Right foot
6 Left foot
7 Tail
8 Torso
9 LED
10 Imaging camera
11 Capacitive distance sensor
12 Microphone
13 Speaker
14 Pressure sensor
15 Control unit
16 CPU
17 memory
21 Status input section
22 Association Database Department
23 Action Search Department
24 Action output section
25 Reliability Learning Department
26 Untargeted Behavior Learning Department
27 Others Structure Learning Department
28 Situational Behavior Learning Department
29 Chain Behavior Learning Department

Claims (28)

所望の動作パタンによって運動する擬似生物を実現する擬似生物装置であって、
この擬似生物装置の内部に、
前記擬似生物周囲の状況を外部パラメータ値として検知する外部状況入力手段と、
前記擬似生物の擬似的感情を内部パラメータ値として保持する内部状況保持手段と、
前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段と、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索手段と、
前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力手段と、
を有する擬似生物装置において、
前記擬似生物装置の内部に設けられ、前記選択された連関情報に基づいて行動した後に検知された前記外部パラメータ値及び保持された前記内部パラメータ値と、前記選択された連関情報の前記行動後の外部パラメータ値及び内部パラメータ値との類似度を計算し、
前記類似度が所定値以上である場合は、前記選択された連関情報の前記遷移確率を増加させて、前記類似度が所定値未満である場合は、前記選択された連関情報の前記遷移確率を減少させる信頼性学習手段を具備したことを特徴とする擬似生物装置。
A simulated biological apparatus that realizes a simulated biological creature that moves according to a desired movement pattern,
Inside this simulated biological device,
External situation input means for detecting the situation around the simulated organism as an external parameter value;
Internal situation holding means for holding the pseudo-animated emotion as an internal parameter value;
The behavior to be performed by the simulated creature, which is realized by combining the operation patterns, and the external parameter value and the internal parameter value of the simulated creature before the behavior, and the state after the behavior, representing the situation before and after the transition by the behavior. Associating database means for storing a plurality of associative information consisting of external parameter values and internal parameter values of the pseudo-living organism, and a transition probability representing how much the transition by the action is established ;
The similarity between the current external parameter value and internal parameter value of the simulated creature, the external parameter value and internal parameter value of the simulated creature before the action stored in the association database means, and the transition probability of the action Based on the association database means to select association information for instructing the behavior to be performed by the simulated organism ,
Action output means for causing the pseudo creature to act based on the selected association information;
In a pseudo-biological device having
Provided inside the simulated biological device, the external parameter value detected after acting based on the selected association information and the retained internal parameter value, and the selected association information after the behavior Calculate the similarity between the external parameter value and the internal parameter value,
When the similarity is greater than or equal to a predetermined value, the transition probability of the selected association information is increased. When the similarity is less than a predetermined value, the transition probability of the selected association information is increased. A pseudo-biological apparatus characterized by comprising a reliability learning means for decreasing.
所望の動作パタンによって運動する擬似生物を実現する擬似生物装置であって、
この擬似生物装置の内部に、
前記擬似生物周囲の状況を外部パラメータ値として検知する外部状況入力手段と、
前記擬似生物の擬似的感情を内部パラメータ値として保持する内部状況保持手段と、
前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段と、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索手段と、
前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力手段と、
を有する擬似生物装置において、
前記擬似生物装置の内部に設けられ、前記選択された連関情報に基づいて行動した後に検知された前記外部パラメータ値及び保持された前記内部パラメータ値と、前記選択された連関情報の前記行動後の外部パラメータ値及び内部パラメータ値との類似度を計算し、
前記類似度が所定値未満である場合は、前記選択された連関情報に基づいて行動する前の前記外部パラメータ値及び内部パラメータ値、前記選択された連関情報の行動、この擬似生物の行動後の前記外部パラメータ値及び前記内部パラメータ値と、1回の試行で1回成功していることを表す遷移確率と、を一組とする連関情報を生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶する目標外行動学習手段を具備したことを特徴とする擬似生物装置。
A simulated biological apparatus that realizes a simulated biological creature that moves according to a desired movement pattern,
Inside this simulated biological device,
External situation input means for detecting the situation around the simulated organism as an external parameter value;
Internal situation holding means for holding the pseudo-animated emotion as an internal parameter value;
The behavior to be performed by the simulated creature, which is realized by combining the operation patterns, and the external parameter value and the internal parameter value of the simulated creature before the behavior, and the state after the behavior, representing the situation before and after the transition by the behavior. Associating database means for storing a plurality of associative information consisting of external parameter values and internal parameter values of the pseudo-living organism, and a transition probability representing how much the transition by the action is established ;
The similarity between the current external parameter value and internal parameter value of the simulated creature, the external parameter value and internal parameter value of the simulated creature before the action stored in the association database means, and the transition probability of the action Based on the association database means to select association information for instructing the behavior to be performed by the simulated organism ,
Action output means for causing the pseudo creature to act based on the selected association information;
In a pseudo-biological device having
Provided inside the simulated biological device, the external parameter value detected after acting based on the selected association information and the retained internal parameter value, and the selected association information after the behavior Calculate the similarity between the external parameter value and the internal parameter value,
When the similarity is less than a predetermined value, the external parameter value and the internal parameter value before acting based on the selected association information, the behavior of the selected association information, the behavior of the simulated organism after the behavior The association information is generated as a set of the external parameter value and the internal parameter value, and a transition probability indicating that the trial has succeeded once in one trial, and the generated association information is stored in the association database. A pseudo-biological apparatus characterized by comprising non-target behavior learning means for storing as association information if not stored in the means.
所望の動作パタンによって運動する擬似生物を実現する擬似生物装置であって、
この擬似生物装置の内部に、
前記擬似生物周囲の状況を外部パラメータ値として検知する外部状況入力手段と、
前記擬似生物の擬似的感情を内部パラメータ値として保持する内部状況保持手段と、
前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段と、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索手段と、
前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力手段と、
を有する擬似生物装置において、
前記外部状況入力手段により検知される外部パラメータ値から被検出体の行動を認識し、
前記検知される外部パラメータ値を、被検出体に関する部分と、当該被検出体を除く環境部分に分解し、当該環境部分を当該被検出体の外部パラメータ値とし、
前記検知される外部パラメータ値に基づいて被検出体の内部パラメータ値を特定するための情報を記憶した辞書情報を用いて、前記認識された行動の前後に検知された外部パラメータ値から前記被検出体の内部パラメータ値を推定し、
前記認識された行動と、当該行動の前後に検知された前記被検出体の外部パラメータ値と、当該行動の前後に検知された外部パラメータ値から前記辞書情報を用いて推定された前記被検出体の内部パラメータ値と、を一組の連関情報として生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ記憶する他者行動学習手段とを具備したことを特徴とする擬似生物装置。
A simulated biological apparatus that realizes a simulated biological creature that moves according to a desired movement pattern,
Inside this simulated biological device,
External situation input means for detecting the situation around the simulated organism as an external parameter value;
Internal situation holding means for holding the pseudo-animated emotion as an internal parameter value;
The behavior to be performed by the simulated creature, which is realized by combining the operation patterns, and the external parameter value and the internal parameter value of the simulated creature before the behavior, and the state after the behavior, representing the situation before and after the transition by the behavior. As a set of linkage information consisting of external parameter values and internal parameter values of the simulated organism , a plurality of linkage database means for storing,
Based on the similarity between the current external parameter value and internal parameter value of the simulated organism and the external parameter value and internal parameter value of the simulated organism before the action stored in the association database means, An action search means for selecting association information for instructing an action to be performed from the association database means ;
Action output means for causing the pseudo creature to act based on the selected association information;
In a pseudo-biological device having
Recognizing the action of the detected object from the external parameter value detected by the external situation input means,
The detected external parameter value is decomposed into a part related to the detected object and an environmental part excluding the detected object, and the environmental part is set as an external parameter value of the detected object.
Using the dictionary information storing information for identifying the internal parameter value of the detected object based on the detected external parameter value, the detected object is detected from the external parameter value detected before and after the recognized action. Estimate the internal parameter values of the body,
The detected object estimated using the dictionary information from the recognized action, the external parameter value of the detected object detected before and after the action, and the external parameter value detected before and after the action The internal parameter value is generated as a set of association information, and the other behavior learning means is stored if the generated association information is not stored in the association database means. Biological equipment.
所望の動作パタンによって運動する擬似生物を実現する擬似生物装置であって、
この擬似生物装置の内部に、
前記擬似生物周囲の状況を外部パラメータ値として検知する外部状況入力手段と、
前記擬似生物の擬似的感情を内部パラメータ値として保持する内部状況保持手段と、
前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段と、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索手段と、
前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力手段と、
を有する擬似生物装置において、
前記連関データベース手段に記憶された前記連関情報から、行動後の外部パラメータ値及び内部パラメータ値が略同一のパラメータ値を有する複数の前記連関情報を抽出し、
前記抽出された前記連関情報のうち、遷移確率が抽出された他の前記連関情報よりも下回る前記連関情報の前記行動前の前記外部パラメータ値及び内部パラメータ値を第1のパラメータ値とし、この他の前記連関情報の前記行動前の前記外部パラメータ値及び内部パラメータ値を第2のパラメータ値とし、前記第1のパラメータ値と、前記第1のパラメータ値を前記第2のパラメータ値へと変化させる行動と、前記第2のパラメータ値と、所定の初期値に設定された遷移確率と、を一組の連関情報として生成し、
この生成された連関情報が前記連関データベース手段に記憶されていなければ記憶する状況調整行動学習手段を具備したことを特徴とする擬似生物装置。
A simulated biological apparatus that realizes a simulated biological creature that moves according to a desired movement pattern,
Inside this simulated biological device,
External situation input means for detecting the situation around the simulated organism as an external parameter value;
Internal situation holding means for holding the pseudo-animated emotion as an internal parameter value;
The behavior to be performed by the simulated creature, which is realized by combining the operation patterns, and the external parameter value and the internal parameter value of the simulated creature before the behavior, and the state after the behavior, representing the situation before and after the transition by the behavior. Associating database means for storing a plurality of associative information consisting of external parameter values and internal parameter values of the pseudo-living organism, and a transition probability representing how much the transition by the action is established ;
The similarity between the current external parameter value and internal parameter value of the simulated creature, the external parameter value and internal parameter value of the simulated creature before the action stored in the association database means, and the transition probability of the action Based on the association database means to select association information for instructing the behavior to be performed by the simulated organism ,
Action output means for causing the pseudo creature to act based on the selected association information;
In a pseudo-biological device having
From the association information stored in the association database means, extract a plurality of the association information having a parameter value having substantially the same external parameter value and internal parameter value after the action,
Among the extracted the associated information, the external parameter value and the internal parameter value before the action of the associated information falls below the other of said associated information transition probability is extracted as a first parameter value, the other The external parameter value and the internal parameter value before the action of the association information are set as second parameter values, and the first parameter value and the first parameter value are changed to the second parameter value. Generating an action, the second parameter value, and a transition probability set to a predetermined initial value as a set of association information;
A simulated biological apparatus, comprising: a situation adjustment behavior learning means for storing the generated association information if it is not stored in the association database means.
所望の動作パタンによって運動する擬似生物を実現する擬似生物装置であって、
この擬似生物装置の内部に、
前記擬似生物周囲の状況を外部パラメータ値として検知する外部状況入力手段と、
前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持する内部状況保持手段と、
前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段と、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索手段と、
前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力手段と、
を有する擬似生物装置において、
前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報と、を抽出し、
前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情が、前記第2の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記第2の連関情報までの行動と、前記第2の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶する連鎖行動学習手段を具備したことを特徴とする擬似生物装置。
A simulated biological apparatus that realizes a simulated biological creature that moves according to a desired movement pattern,
Inside this simulated biological device,
External situation input means for detecting the situation around the simulated organism as an external parameter value;
An internal situation holding means for holding a pseudo emotion having at least the pleasant emotion of the pseudo organism as an internal parameter value;
The behavior to be performed by the simulated creature, which is realized by combining the operation patterns, and the external parameter value and the internal parameter value of the simulated creature before the behavior, and the state after the behavior, representing the situation before and after the transition by the behavior. As a set of linkage information consisting of external parameter values and internal parameter values of the simulated organism , a plurality of linkage database means for storing,
Based on the similarity between the current external parameter value and internal parameter value of the simulated organism and the external parameter value and internal parameter value of the simulated organism before the action stored in the association database means, An action search means for selecting association information for instructing an action to be performed from the association database means ;
Action output means for causing the pseudo creature to act based on the selected association information;
In a pseudo-biological device having
Of the association information stored in the association database means, the first association information and the external parameter value and the internal parameter value of the simulated creature after the behavior of the first association information substantially coincide with each other before the behavior. Extracting the second association information having the external parameter value and the internal parameter value of the simulated organism,
The pleasant feeling in the external parameter value and the internal parameter value of the simulated organism before the action of the first linkage information is the external parameter value and the internal parameter value of the simulated organism after the behavior of the second linkage information. when less than pleasantness, and the external parameter value and intrinsic parameters of the pseudo organism before the action the first association information, an action from the first association information to the second association information, the first The external parameter value and the internal parameter value of the simulated creature after the action of the two association information are generated as a set of association information, and if the generated association information is not stored in the association database means, the association information A pseudo-biological apparatus characterized by comprising a chain behavior learning means for storing as:
所望の動作パタンによって運動する擬似生物を実現する擬似生物装置であって、
この擬似生物装置の内部に、
前記擬似生物周囲の状況を外部パラメータ値として検知する外部状況入力手段と、
前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持する内部状況保持手段と、
前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段と、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索手段と、
前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力手段と、
を有する擬似生物装置において、
前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報と、この第2の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第3の連関情報とを抽出し、
前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情が、前記第3の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記第2の連関情報の行動及び前記第2の連関情報から前記第3の連関情報までの行動と、前記第3の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶する連鎖行動学習手段を具備したことを特徴とする擬似生物装置。
A simulated biological apparatus that realizes a simulated biological creature that moves according to a desired movement pattern,
Inside this simulated biological device,
External situation input means for detecting the situation around the simulated organism as an external parameter value;
An internal situation holding means for holding a pseudo emotion having at least the pleasant emotion of the pseudo organism as an internal parameter value;
The behavior to be performed by the simulated creature, which is realized by combining the operation patterns, and the external parameter value and the internal parameter value of the simulated creature before the behavior, and the state after the behavior, representing the situation before and after the transition by the behavior. As a set of linkage information consisting of external parameter values and internal parameter values of the simulated organism , a plurality of linkage database means for storing,
Based on the similarity between the current external parameter value and internal parameter value of the simulated organism and the external parameter value and internal parameter value of the simulated organism before the action stored in the association database means, An action search means for selecting association information for instructing an action to be performed from the association database means ;
Action output means for causing the pseudo creature to act based on the selected association information;
In a pseudo-biological device having
Of the association information stored in the association database means, the first association information and the external parameter value and the internal parameter value of the simulated creature after the behavior of the first association information substantially coincide with each other before the behavior. The second association information having the external parameter value and the internal parameter value of the simulated creature, and the external parameter value and the internal parameter value of the simulated creature after the behavior of the second linkage information substantially match with each other before the behavior Extracting the third association information having the external parameter value and the internal parameter value of the simulated organism,
The pleasant feeling in the external parameter value and the internal parameter value of the pseudo organism before the action of the first linkage information is the external parameter value and the internal parameter value of the pseudo organism after the action of the third linkage information. when less than pleasantness, wherein the external parameter value and intrinsic parameters of the pseudo organism before behavioral first association information, the first from the association information activity and the second of said second association information an action from association information to said third linkage information, generated as the third said pseudo biological external parameter values and intrinsic parameters and a set of associated information of the post-action association information, the generated If the association information is not stored in the association database means, the pseudo-biological apparatus is provided with chain behavior learning means for storing the association information as association information.
所望の動作パタンによって運動する擬似生物を実現する擬似生物装置であって、
この擬似生物装置の内部に、
前記擬似生物周囲の状況を外部パラメータ値として検知する外部状況入力手段と、
前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持する内部状況保持手段と、
前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段と、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索手段と、
前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力手段と、
を有する擬似生物装置において、
前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報とを1連鎖とするn(ただしnは2以上の自然数)連鎖なる(n+1)個の前記連関情報を抽出し、
前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情が、前記n連鎖目の第(n+1)の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、
前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記(n+1)の連関情報までの(n+1)個の前記行動を、(n+1)個の前記連関情報が並べられた順序で行う行動と、前記第(n+1)の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶する連鎖行動学習手段を具備したことを特徴とする擬似生物装置。
A simulated biological apparatus that realizes a simulated biological creature that moves according to a desired movement pattern,
Inside this simulated biological device,
External situation input means for detecting the situation around the simulated organism as an external parameter value;
An internal situation holding means for holding a pseudo emotion having at least the pleasant emotion of the pseudo organism as an internal parameter value;
The behavior to be performed by the simulated creature, which is realized by combining the operation patterns, and the external parameter value and the internal parameter value of the simulated creature before the behavior, and the state after the behavior, representing the situation before and after the transition by the behavior. As a set of linkage information consisting of external parameter values and internal parameter values of the simulated organism , a plurality of linkage database means for storing,
Based on the similarity between the current external parameter value and internal parameter value of the simulated organism and the external parameter value and internal parameter value of the simulated organism before the action stored in the association database means, An action search means for selecting association information for instructing an action to be performed from the association database means ;
Action output means for causing the pseudo creature to act based on the selected association information;
In a pseudo-biological device having
Of the association information stored in the association database means, the first association information and the external parameter value and the internal parameter value of the simulated creature after the behavior of the first association information substantially coincide with each other before the behavior. Extracting n (n + 1) pieces of linkage information in which n linkages (where n is a natural number of 2 or more) are linked to the second linkage information having the external parameter value and the internal parameter value of the pseudo creature,
The pleasant parameter in the external parameter value and internal parameter value before the action of the first linkage information is the external parameter value of the pseudo creature after the action of the (n + 1) th linkage information in the n- th chain And lower than the pleasant feeling in the internal parameter value,
Wherein the external parameter value and intrinsic parameters of the pseudo organism before behavioral first association information, the action associated information to the (n + 1) number of the from the first association information the (n + 1), ( (n + 1) generation of the association information in the order in which the association information is arranged, and the external parameter value and the internal parameter value of the simulated creature after the behavior of the (n + 1) th association information are generated as a set of association information A pseudo-biological apparatus comprising chain action learning means for storing the generated association information as association information if it is not stored in the association database means.
所望の動作パタンによって運動する擬似生物を実現し、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置における擬似生物の行動形成方法であって、
前記擬似生物周囲の状況を外部パラメータ値として検知する工程と、
前記擬似生物の擬似的感情を内部パラメータ値として保持する工程と、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索工程と、
前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力工程と、
前記選択された連関情報に基づいて行動した後に検知された前記外部パラメータ値及び保持された前記内部パラメータ値と、前記選択された連関情報の前記行動後の外部パラメータ値及び内部パラメータ値との類似度を計算し、
前記類似度が所定値以上である場合は、前記選択された連関情報の前記遷移確率を増加させて、前記類似度が所定値未満である場合は、前記選択された連関情報の前記遷移確率を減少させる信頼性学習工程と、
を有することを特徴とする擬似生物装置における擬似生物の行動形成方法。
Realizing a simulated creature that moves according to a desired motion pattern, which is realized by combining the motion patterns, the behavior to be performed by the simulated creature, and the simulated creature before the behavior that represents the situation before and after the transition by the behavior External parameter value and internal parameter value, and external parameter value and internal parameter value of the simulated creature after the action, and a transition probability indicating how much the transition by the action is established. A method for forming a behavior of a simulated organism in a simulated organism device having association database means for storing a plurality of association information ,
Detecting the surrounding environment of the simulated organism as an external parameter value;
Holding the pseudo-animated emotion as an internal parameter value;
The similarity between the current external parameter value and internal parameter value of the simulated creature, the external parameter value and internal parameter value of the simulated creature before the action stored in the association database means, and the transition probability of the action Based on the behavior search step of selecting, from the association database means, association information for instructing the behavior to be performed by the simulated organism ,
An action output step for causing the simulated creature to act based on the selected association information;
Similarity between the external parameter value and the retained internal parameter value detected after acting based on the selected association information, and the external parameter value and internal parameter value after the behavior of the selected association information Calculate the degree,
When the similarity is greater than or equal to a predetermined value, the transition probability of the selected association information is increased, and when the similarity is less than a predetermined value, the transition probability of the selected association information is increased. A reduced reliability learning process;
A method for forming behavior of a simulated organism in a simulated organism device.
所望の動作パタンによって運動する擬似生物を実現し、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置における擬似生物の行動形成方法であって、
前記擬似生物周囲の状況を外部パラメータ値として検知する工程と、
前記擬似生物の擬似的感情を内部パラメータ値として保持する工程と、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索工程と、
前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力工程と、
前記選択された連関情報に基づいて行動した後に検知された前記外部パラメータ値及び保持された前記内部パラメータ値と、前記選択された連関情報の前記行動後の外部パラメータ値及び内部パラメータ値との類似度を計算し、
前記類似度が所定値未満である場合は、前記選択された連関情報に基づいて行動する前の前記外部パラメータ値及び内部パラメータ値、前記選択された連関情報の行動、この擬似生物の行動後の前記外部パラメータ値及び前記内部パラメータ値と、1回の試行で1回成功していることを表す遷移確率と、を一組とする連関情報を生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶する目標外行動学習工程と、
を有することを特徴とする擬似生物装置における擬似生物の行動形成方法。
Realizing a simulated creature that moves according to a desired motion pattern, which is realized by combining the motion patterns, the behavior to be performed by the simulated creature, and the simulated creature before the behavior that represents the situation before and after the transition by the behavior External parameter value and internal parameter value, and external parameter value and internal parameter value of the simulated creature after the action, and a transition probability indicating how much the transition by the action is established. A method for forming a behavior of a simulated organism in a simulated organism device having association database means for storing a plurality of association information ,
Detecting the surrounding environment of the simulated organism as an external parameter value;
Holding the pseudo-animated emotion as an internal parameter value;
The similarity between the current external parameter value and internal parameter value of the simulated creature, the external parameter value and internal parameter value of the simulated creature before the action stored in the association database means, and the transition probability of the action Based on the behavior search step of selecting, from the association database means, association information for instructing the behavior to be performed by the simulated organism ,
An action output step for causing the simulated creature to act based on the selected association information;
Similarity between the external parameter value and the retained internal parameter value detected after acting based on the selected association information, and the external parameter value and internal parameter value after the behavior of the selected association information Calculate the degree,
When the similarity is less than a predetermined value, the external parameter value and the internal parameter value before acting based on the selected association information, the behavior of the selected association information, the behavior of the simulated creature after the behavior The association information is generated as a set of the external parameter value and the internal parameter value, and a transition probability indicating that the trial has succeeded once in one trial, and the generated association information is stored in the association database. A non-target behavior learning step of storing as association information if not stored in the means;
A method for forming behavior of a simulated organism in a simulated organism device.
所望の動作パタンによって運動する擬似生物を実現し、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置における擬似生物の行動形成方法であって、
前記擬似生物周囲の状況を外部パラメータ値として検知する工程と、
前記擬似生物の擬似的感情を内部パラメータ値として保持する工程と、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関デー タベース手段から選択する行動検索工程と、
前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力工程と、
前記検知される外部パラメータ値から被検出体の行動を認識し、
前記検知される外部パラメータ値を、被検出体に関する部分と、当該被検出体を除く環境部分に分解し、当該環境部分を当該被検出体の外部パラメータ値とし、
前記検知される外部パラメータ値に基づいて被検出体の内部パラメータ値を特定するための情報を記憶した辞書情報を用いて、前記認識された行動の前後に検知された外部パラメータ値から前記被検出体の内部パラメータ値を推定し、
前記認識された行動と、当該行動の前後に検知された前記被検出体の外部パラメータ値と、当該行動の前後に検知された外部パラメータ値から前記辞書情報を用いて推定された前記被検出体の内部パラメータ値と、を一組の連関情報として生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ記憶する他者行動学習工程と、
を有することを特徴とする擬似生物装置における擬似生物の行動形成方法。
Realizing a simulated creature that moves according to a desired motion pattern, which is realized by combining the motion patterns, the behavior to be performed by the simulated creature, and the simulated creature before the behavior that represents the situation before and after the transition by the behavior Of the simulated organism in the simulated organism device having a plurality of association database means for storing a plurality of association information as a set of association information consisting of the external parameter value and the internal parameter value of the An action formation method ,
Detecting the surrounding environment of the simulated organism as an external parameter value;
Holding the pseudo-animated emotion as an internal parameter value;
Based on the similarity between the current external parameter value and internal parameter value of the simulated organism and the external parameter value and internal parameter value of the simulated organism before the action stored in the association database means, an action search step of selecting the associated information indicating the actions to be performed from the association database means,
An action output step for causing the simulated creature to act based on the selected association information;
Recognizing the action of the detected object from the detected external parameter value,
The detected external parameter value is decomposed into a part related to the detected object and an environmental part excluding the detected object, and the environmental part is set as an external parameter value of the detected object.
Using the dictionary information storing information for identifying the internal parameter value of the detected object based on the detected external parameter value, the detected object is detected from the external parameter value detected before and after the recognized action. Estimate the internal parameter values of the body,
The detected object estimated using the dictionary information from the recognized action, the external parameter value of the detected object detected before and after the action, and the external parameter value detected before and after the action An internal parameter value as a set of association information, and storing the other association behavior learning step if the generated association information is not stored in the association database means,
A method for forming behavior of a simulated organism in a simulated organism device.
所望の動作パタンによって運動する擬似生物を実現し、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置における擬似生物の行動形成方法であって、
前記擬似生物周囲の状況を外部パラメータ値として検知する工程と、
前記擬似生物の擬似的感情を内部パラメータ値として保持する工程と、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索工程と、
前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力工程と、
前記連関データベース手段に記憶された前記連関情報から、行動後の外部パラメータ値及び内部パラメータ値が略同一のパラメータ値を有する複数の前記連関情報を抽出し、
前記抽出された前記連関情報のうち、遷移確率が抽出された他の前記連関情報よりも下回る前記連関情報の前記行動前の前記外部パラメータ値及び内部パラメータ値を第1のパラメータ値とし、この他の前記連関情報の前記行動前の前記外部パラメータ値及び内部パラメータ値を第2のパラメータ値とし、前記第1のパラメータ値と、前記第1のパラメータ値を前記第2のパラメータ値へと変化させる行動と、前記第2のパラメータ値と、所定の初期値に設定された遷移確率と、を一組の連関情報として生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ記憶する状況調整行動学習工程と、
を有することを特徴とする擬似生物装置における擬似生物の行動形成方法。
Realizing a simulated creature that moves according to a desired motion pattern, which is realized by combining the motion patterns, the behavior to be performed by the simulated creature, and the simulated creature before the behavior that represents the situation before and after the transition by the behavior External parameter value and internal parameter value, and external parameter value and internal parameter value of the simulated creature after the action, and a transition probability indicating how much the transition by the action is established. A method for forming a behavior of a simulated organism in a simulated organism device having association database means for storing a plurality of association information ,
Detecting the surrounding environment of the simulated organism as an external parameter value;
Holding the pseudo-animated emotion as an internal parameter value;
The similarity between the current external parameter value and internal parameter value of the simulated creature, the external parameter value and internal parameter value of the simulated creature before the action stored in the association database means, and the transition probability of the action Based on the behavior search step of selecting, from the association database means, association information for instructing the behavior to be performed by the simulated organism ,
An action output step for causing the simulated creature to act based on the selected association information;
From the association information stored in the association database means, extract a plurality of the association information having a parameter value having substantially the same external parameter value and internal parameter value after the action,
Among the extracted the associated information, the external parameter value and the internal parameter value before the action of the associated information falls below the other of said associated information transition probability is extracted as a first parameter value, the other The external parameter value and the internal parameter value before the action of the association information are set as second parameter values, and the first parameter value and the first parameter value are changed to the second parameter value. An action, the second parameter value, and the transition probability set to a predetermined initial value are generated as a set of association information, and the generated association information is not stored in the association database means. Memorizing situation adjustment behavior learning process;
A method for forming behavior of a simulated organism in a simulated organism device.
所望の動作パタンによって運動する擬似生物を実現し、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置における擬似生物の行動形成方法であって、
前記擬似生物周囲の状況を外部パラメータ値として検知する工程と、
前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持する工程と、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索工程と、
前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力工程と、
前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報と、を抽出し、
前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情が、前記第2の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記第2の連関情報までの行動と、前記第2の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶する連鎖行動学習工程と、
を有することを特徴とする擬似生物装置における擬似生物の行動形成方法。
Realizing a simulated creature that moves according to a desired motion pattern, which is realized by combining the motion patterns, the behavior to be performed by the simulated creature, and the simulated creature before the behavior that represents the situation before and after the transition by the behavior Of the simulated organism in the simulated organism device having a plurality of association database means for storing a plurality of association information as a set of association information consisting of the external parameter value and the internal parameter value of the An action formation method ,
Detecting the surrounding environment of the simulated organism as an external parameter value;
Holding the pseudo emotion having at least the pleasant emotion of the pseudo organism as an internal parameter value;
Based on the similarity between the current external parameter value and internal parameter value of the simulated organism and the external parameter value and internal parameter value of the simulated organism before the action stored in the association database means, An action search step for selecting association information for instructing an action to be performed from the association database means ;
An action output step for causing the simulated creature to act based on the selected association information;
Of the association information stored in the association database means, the first association information and the external parameter value and the internal parameter value of the simulated creature after the behavior of the first association information substantially coincide with each other before the behavior. Extracting the second association information having the external parameter value and the internal parameter value of the simulated organism,
The pleasant feeling in the external parameter value and the internal parameter value of the simulated organism before the action of the first linkage information is the external parameter value and the internal parameter value of the simulated organism after the behavior of the second linkage information. when less than pleasantness, and the external parameter value and intrinsic parameters of the pseudo organism before the action the first association information, an action from the first association information to the second association information, the first The external parameter value and the internal parameter value of the simulated creature after the action of the two association information are generated as a set of association information, and if the generated association information is not stored in the association database means, the association information As a chain action learning process,
A method for forming behavior of a simulated organism in a simulated organism device.
所望の動作パタンによって運動する擬似生物を実現し、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置における擬似生物の行動形成方法であって、
前記擬似生物周囲の状況を外部パラメータ値として検知する工程と、
前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持する工程と、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索工程と、
前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力工程と、
前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報と、この第2の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第3の連関情報とを抽出し、
前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情が、前記第3の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記第2の連関情報の行動及び前記第2の連関情報から前記第3の連関情報までの行動と、前記第3の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶する連鎖行動学習工程と、
を有することを特徴とする擬似生物装置における擬似生物の行動形成方法。
Realizing a simulated creature that moves according to a desired motion pattern, which is realized by combining the motion patterns, the behavior to be performed by the simulated creature, and the simulated creature before the behavior that represents the situation before and after the transition by the behavior Of the simulated organism in the simulated organism device having a plurality of association database means for storing a plurality of association information as a set of association information consisting of the external parameter value and the internal parameter value of the An action formation method ,
Detecting the surrounding environment of the simulated organism as an external parameter value;
Holding the pseudo emotion having at least the pleasant emotion of the pseudo organism as an internal parameter value;
Based on the similarity between the current external parameter value and internal parameter value of the simulated organism and the external parameter value and internal parameter value of the simulated organism before the action stored in the association database means, An action search step for selecting association information for instructing an action to be performed from the association database means ;
An action output step for causing the simulated creature to act based on the selected association information;
Of the association information stored in the association database means, the first association information and the external parameter value and the internal parameter value of the simulated creature after the behavior of the first association information substantially coincide with each other before the behavior. The second association information having the external parameter value and the internal parameter value of the simulated creature, and the external parameter value and the internal parameter value of the simulated creature after the behavior of the second linkage information substantially match with each other before the behavior Extracting the third association information having the external parameter value and the internal parameter value of the simulated organism,
The pleasant feeling in the external parameter value and the internal parameter value of the pseudo organism before the action of the first linkage information is the external parameter value and the internal parameter value of the pseudo organism after the action of the third linkage information. when less than pleasantness, wherein the external parameter value and intrinsic parameters of the pseudo organism before behavioral first association information, the first from the association information activity and the second of said second association information an action from association information to said third linkage information, generated as the third said pseudo biological external parameter values and intrinsic parameters and a set of associated information of the post-action association information, the generated If the association information is not stored in the association database means, a chain action learning step of storing as association information;
A method for forming behavior of a simulated organism in a simulated organism device.
所望の動作パタンによって運動する擬似生物を実現し、前記動作パタンを組み合わせて 実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置における擬似生物の行動形成方法であって、
前記擬似生物周囲の状況を外部パラメータ値として検知する工程と、
前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持する工程と、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択する行動検索工程と、
前記選択された連関情報に基づいて前記擬似生物に行動させる行動出力工程と、
前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報とを1連鎖とするn(ただしnは2以上の自然数)連鎖なる(n+1)個の前記連関情報を抽出し、
前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情が、前記n連鎖目の第(n+1)の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、
前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記(n+1)の連関情報までの(n+1)個の前記行動を、(n+1)個の前記連関情報が並べられた順序で行う行動と、前記第(n+1)の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶する連鎖行動学習工程と、
を有することを特徴とする擬似生物装置における擬似生物の行動形成方法。
Realizing a simulated creature that moves according to a desired motion pattern, which is realized by combining the motion patterns, the behavior to be performed by the simulated creature, and the simulated creature before the behavior that represents the situation before and after the transition by the behavior Of the simulated organism in the simulated organism device having a plurality of association database means for storing a plurality of association information as a set of association information consisting of the external parameter value and the internal parameter value of the An action formation method ,
Detecting the surrounding environment of the simulated organism as an external parameter value;
Holding the pseudo emotion having at least the pleasant emotion of the pseudo organism as an internal parameter value;
Based on the similarity between the current external parameter value and internal parameter value of the simulated organism and the external parameter value and internal parameter value of the simulated organism before the action stored in the association database means, An action search step for selecting association information for instructing an action to be performed from the association database means ;
An action output step for causing the simulated creature to act based on the selected association information;
Of the association information stored in the association database means, the first association information and the external parameter value and the internal parameter value of the simulated creature after the behavior of the first association information substantially coincide with each other before the behavior. Extracting n (n + 1) pieces of linkage information in which n linkages (where n is a natural number of 2 or more) are linked to the second linkage information having the external parameter value and the internal parameter value of the pseudo creature,
The pleasant parameter in the external parameter value and internal parameter value before the action of the first linkage information is the external parameter value of the pseudo creature after the action of the (n + 1) th linkage information in the n- th chain And lower than the pleasant feeling in the internal parameter value,
Wherein the external parameter value and intrinsic parameters of the pseudo organism before behavioral first association information, the action associated information to the (n + 1) number of the from the first association information the (n + 1), ( (n + 1) generation of the association information in the order in which the association information is arranged, and the external parameter value and the internal parameter value of the simulated creature after the behavior of the (n + 1) th association information are generated as a set of association information A linkage action learning step of storing the generated association information as association information if the association database means is not stored;
A method for forming behavior of a simulated organism in a simulated organism device.
所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるプログラムをコンピュータ読み取り可能なように記憶させた記憶媒体であって、
前記擬似生物周囲の状況を外部パラメータ値として検知させ、
前記擬似生物の擬似的感情を内部パラメータ値として保持させ、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させ、
前記選択された連関情報に基づいて前記擬似生物に行動させ
前記選択された連関情報に基づいて行動させた後で検知された前記外部パラメータ値及び保持された前記内部パラメータ値と、前記選択された連関情報の前記行動後の外部パラメータ値及び内部パラメータ値との類似度を計算させ、
前記類似度が所定値以上である場合は、前記選択された連関情報の前記遷移確率を増加させて、前記類似度が所定値未満である場合は、前記選択された連関情報の前記遷移確率を減少させるプログラムを記憶したコンピュータ読み取り可能な記憶媒体。
The pre-behavior pre-behavior representing the behavior to be performed by the pseudo-living organism, which is realized by operating the pseudo-living organism that moves according to the desired motion pattern, and the situation before and after transition by the behavior External parameter value and internal parameter value, and external parameter value and internal parameter value of the simulated creature after the action, and a transition probability indicating how much the transition by the action is established. A storage medium that stores a computer-readable program for operating a simulated biological apparatus having a plurality of association database means for storing association information ,
The situation around the simulated organism is detected as an external parameter value,
Holding the pseudo-animated emotion as an internal parameter value,
The similarity between the current external parameter value and internal parameter value of the simulated creature, the external parameter value and internal parameter value of the simulated creature before the action stored in the association database means, and the transition probability of the action Based on the association database means to select the association information for instructing the behavior to be performed by the simulated organism ,
Based on the selected linkage information, make the pseudo creature act ,
The external parameter value detected after acting based on the selected association information and the retained internal parameter value, and the external parameter value and internal parameter value after the behavior of the selected association information, To calculate the similarity of
When the similarity is greater than or equal to a predetermined value, the transition probability of the selected association information is increased, and when the similarity is less than a predetermined value, the transition probability of the selected association information is increased. A computer-readable storage medium storing a program to be reduced.
所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるプログラムをコンピュータ読み取り可能なように記憶させた記憶媒体であって、
前記擬似生物周囲の状況を外部パラメータ値として検知させ、
前記擬似生物の擬似的感情を内部パラメータ値として保持させ、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させ、
前記選択された連関情報に基づいて前記擬似生物に行動させ
前記選択された連関情報に基づいて行動させた後で検知された前記外部パラメータ値及び保持された前記内部パラメータ値と、前記選択された連関情報の前記行動後の外部パラメータ値及び内部パラメータ値との類似度を計算させ、
前記類似度が所定値未満である場合は、前記選択された連関情報に基づいて行動させる前の前記外部パラメータ値及び内部パラメータ値、前記選択された連関情報の行動、この擬似生物の行動後の前記外部パラメータ値及び前記内部パラメータ値と、1回の試行で1回成功していることを表す遷移確率と、を一組とする連関情報を生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶させるプログラムを記憶したコンピュータ読み取り可能な記憶媒体。
The pre-behavior pre-behavior representing the behavior to be performed by the pseudo-living organism, which is realized by operating the pseudo-living organism that moves according to the desired motion pattern, and the situation before and after transition by the behavior External parameter value and internal parameter value, and external parameter value and internal parameter value of the simulated creature after the action, and a transition probability indicating how much the transition by the action is established. A storage medium that stores a computer-readable program for operating a simulated biological apparatus having a plurality of association database means for storing association information ,
The situation around the simulated organism is detected as an external parameter value,
Holding the pseudo-animated emotion as an internal parameter value,
The similarity between the current external parameter value and internal parameter value of the simulated creature, the external parameter value and internal parameter value of the simulated creature before the action stored in the association database means, and the transition probability of the action Based on the association database means to select the association information for instructing the behavior to be performed by the simulated organism ,
Based on the selected linkage information, make the pseudo creature act ,
The external parameter value detected after acting based on the selected association information and the retained internal parameter value, and the external parameter value and internal parameter value after the behavior of the selected association information, To calculate the similarity of
When the similarity is less than a predetermined value, the external parameter value and the internal parameter value before acting based on the selected association information, the behavior of the selected association information, The association information is generated as a set of the external parameter value and the internal parameter value, and a transition probability indicating that the trial has succeeded once in one trial, and the generated association information is stored in the association database. A computer-readable storage medium storing a program to be stored as association information if not stored in the means.
所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるプログラムをコンピュータ読み取り可能なように記憶させた記憶媒体であって、
前記擬似生物周囲の状況を外部パラメータ値として検知させ、
前記擬似生物の擬似的感情を内部パラメータ値として保持させ、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させ、
前記選択された連関情報に基づいて前記擬似生物に行動させ
前記検知される外部パラメータ値から被検出体の行動を認識させ、
前記検知される外部パラメータ値を、被検出体に関する部分と、当該被検出体を除く環境部分に分解し、当該環境部分を当該被検出体の外部パラメータ値とし、
前記検知される外部パラメータ値に基づいて被検出体の内部パラメータ値を特定するための情報を記憶した辞書情報を用いて、前記認識された行動の前後に検知された外部パラメータ値から前記被検出体の内部パラメータ値を推定させ、
前記認識された行動と、当該行動の前後に検知された前記被検出体の外部パラメータ値と、当該行動の前後に検知された外部パラメータ値から前記辞書情報を用いて推定された前記被検出体の内部パラメータ値と、を一組の連関情報として生成させ、この生成された連関情報が前記連関データベース手段に記憶されていなければ記憶させるプログラムを記憶したコンピュータ読み取り可能な記憶媒体。
The pre-behavior pre-behavior representing the behavior to be performed by the pseudo-living organism, which is realized by operating the pseudo-living organism that moves according to the desired motion pattern, and the situation before and after transition by the behavior A program for operating a simulated biological apparatus having association database means for storing a plurality of association information as a set of association information composed of external parameter values and internal parameter values and external parameter values and internal parameter values of the simulated creature after the action Is a storage medium that is stored so that it can be read by a computer,
The situation around the simulated organism is detected as an external parameter value,
Holding the pseudo-animated emotion as an internal parameter value,
Based on the similarity between the current external parameter value and internal parameter value of the simulated organism and the external parameter value and internal parameter value of the simulated organism before the action stored in the association database means, The association information that instructs the action to be performed is selected from the association database means ,
Based on the selected linkage information, make the pseudo creature act ,
Recognize the action of the detected object from the detected external parameter value,
The detected external parameter value is decomposed into a part related to the detected object and an environmental part excluding the detected object, and the environmental part is set as an external parameter value of the detected object.
Using the dictionary information storing information for specifying the internal parameter value of the detected object based on the detected external parameter value, the detected object is detected from the external parameter value detected before and after the recognized action. Estimate the internal parameter values of the body,
The detected object estimated using the dictionary information from the recognized action, the external parameter value of the detected object detected before and after the action, and the external parameter value detected before and after the action A computer-readable storage medium storing a program for generating the internal parameter value as a set of association information and storing the generated association information if the association information is not stored in the association database means.
所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせ て実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるプログラムをコンピュータ読み取り可能なように記憶させた記憶媒体であって、
前記擬似生物周囲の状況を外部パラメータ値として検知させ、
前記擬似生物の擬似的感情を内部パラメータ値として保持させ、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させ、
前記選択された連関情報に基づいて前記擬似生物に行動させ
前記連関データベース手段に記憶された前記連関情報から、行動後の外部パラメータ値及び内部パラメータ値が略同一のパラメータ値を有する複数の前記連関情報を抽出させ、
前記抽出された前記連関情報のうち、遷移確率が抽出された他の前記連関情報よりも下回る前記連関情報の前記行動前の前記外部パラメータ値及び内部パラメータ値を第1のパラメータ値とし、この他の前記連関情報の前記行動前の前記外部パラメータ値及び内部パラメータ値を第2のパラメータ値とし、前記第1のパラメータ値と、前記第1のパラメータ値を前記第2のパラメータ値へと変化させる行動と、前記第2のパラメータ値と、所定の初期値に設定された遷移確率と、を一組の連関情報として生成させ、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶させるプログラムを記憶したコンピュータ読み取り可能な記憶媒体。
Operating the pseudo organism that moves with the desired operation pattern is realized by combining the operation pattern, the action to be performed by the said pseudo-organism, representing the front and rear status transition by the action before the action the pseudo organism External parameter value and internal parameter value, and external parameter value and internal parameter value of the simulated creature after the action, and a transition probability indicating how much the transition by the action is established. A storage medium that stores a computer-readable program for operating a simulated biological apparatus having a plurality of association database means for storing association information ,
The situation around the simulated organism is detected as an external parameter value,
Holding the pseudo-animated emotion as an internal parameter value,
The similarity between the current external parameter value and internal parameter value of the simulated creature, the external parameter value and internal parameter value of the simulated creature before the action stored in the association database means, and the transition probability of the action Based on the association database means to select the association information for instructing the behavior to be performed by the simulated organism ,
Based on the selected linkage information, make the pseudo creature act ,
From the association information stored in the association database means, extract a plurality of the association information having parameter values that are substantially the same as the external parameter value after the action and the internal parameter value,
Among the extracted the associated information, the external parameter value and the internal parameter value before the action of the associated information falls below the other of said associated information transition probability is extracted as a first parameter value, the other The external parameter value and the internal parameter value before the action of the association information are set as second parameter values, and the first parameter value and the first parameter value are changed to the second parameter value. An action, the second parameter value, and the transition probability set to a predetermined initial value are generated as a set of association information, and the generated association information is not stored in the association database means. A computer-readable storage medium storing a program to be stored as association information.
所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるプログラムをコンピュータ読み取り可能なように記憶させた記憶媒体であって、
前記擬似生物周囲の状況を外部パラメータ値として検知させ、
前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持させ、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させ、
前記選択された連関情報に基づいて前記擬似生物に行動させ
前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報と、を抽出させ、
前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情が、前記第2の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記第2の連関情報までの行動と、前記第2の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成させ、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶させるプログラムを記憶したコンピュータ読み取り可能な記憶媒体。
The pre-behavior pre-behavior representing the behavior to be performed by the pseudo-living organism, which is realized by operating the pseudo-living organism that moves according to the desired motion pattern, and the situation before and after transition by the behavior A program for operating a simulated biological apparatus having association database means for storing a plurality of association information as a set of association information composed of external parameter values and internal parameter values and external parameter values and internal parameter values of the simulated creature after the action Is a storage medium that is stored so that it can be read by a computer,
The situation around the simulated organism is detected as an external parameter value,
Holding a pseudo emotion having at least the pleasant emotion of the pseudo organism as an internal parameter value;
Based on the similarity between the current external parameter value and internal parameter value of the simulated organism and the external parameter value and internal parameter value of the simulated organism before the action stored in the association database means, The association information that instructs the action to be performed is selected from the association database means ,
Based on the selected linkage information, make the pseudo creature act ,
Of the association information stored in the association database means, the first association information and the external parameter value and the internal parameter value of the simulated creature after the behavior of the first association information substantially coincide with each other before the behavior. Second association information having external parameter values and internal parameter values of the simulated organism,
The pleasant feeling in the external parameter value and the internal parameter value of the simulated organism before the action of the first linkage information is the external parameter value and the internal parameter value of the simulated organism after the behavior of the second linkage information. when less than pleasantness, and the external parameter value and intrinsic parameters of the pseudo organism before the action the first association information, an action from the first association information to the second association information, the first The external parameter value and the internal parameter value of the simulated organism after the action of the two association information are generated as a set of association information, and if the generated association information is not stored in the association database means, the association information A computer-readable storage medium storing a program to be stored.
所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるプログラムをコンピュータ読み取り可能なように記憶させた記憶媒体であって、
前記擬似生物周囲の状況を外部パラメータ値として検知させ、
前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持させ、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させ、
前記選択された連関情報に基づいて前記擬似生物に行動させ
前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報と、この第2の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第3の連関情報とを抽出させ、
前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情が、前記第3の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記第2の連関情報の行動及び前記第2の連関情報から前記第3の連関情報までの行動と、前記第3の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成させ、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶させるプログラムを記憶したコンピュータ読み取り可能な記憶媒体。
The pre-behavior pre-behavior representing the behavior to be performed by the pseudo-living organism, which is realized by operating the pseudo-living organism that moves according to the desired motion pattern, and the situation before and after transition by the behavior A program for operating a simulated biological apparatus having association database means for storing a plurality of association information as a set of association information composed of external parameter values and internal parameter values and external parameter values and internal parameter values of the simulated creature after the action Is a storage medium that is stored so that it can be read by a computer,
The situation around the simulated organism is detected as an external parameter value,
Holding a pseudo emotion having at least the pleasant emotion of the pseudo organism as an internal parameter value;
Based on the similarity between the current external parameter value and internal parameter value of the simulated organism and the external parameter value and internal parameter value of the simulated organism before the action stored in the association database means, The association information that instructs the action to be performed is selected from the association database means ,
Based on the selected linkage information, make the pseudo creature act ,
Of the association information stored in the association database means, the first association information and the external parameter value and the internal parameter value of the simulated creature after the behavior of the first association information substantially coincide with each other before the behavior. The second association information having the external parameter value and the internal parameter value of the simulated creature, and the external parameter value and the internal parameter value of the simulated creature after the behavior of the second linkage information substantially match with each other before the behavior Extracting the third association information having the external parameter value and the internal parameter value of the pseudo-biology,
The pleasant feeling in the external parameter value and the internal parameter value of the pseudo organism before the action of the first linkage information is the external parameter value and the internal parameter value of the pseudo organism after the action of the third linkage information. when less than pleasantness, wherein the external parameter value and intrinsic parameters of the pseudo organism before behavioral first association information, the first from the association information activity and the second of said second association information an action from association information to said third linkage information, and the external parameter values and intrinsic parameters of the pseudo organism after action of the third association information, is generated as a set of association information, the generated A computer-readable storage medium storing a program to be stored as association information if the association information is not stored in the association database means.
所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるプログラムをコンピュータ読み取り可能なように記憶させた記憶媒体であって、
前記擬似生物周囲の状況を外部パラメータ値として検知させ、
前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持させ、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させ、
前記選択された連関情報に基づいて前記擬似生物に行動させ
前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報とを1連鎖とするn(ただしnは2以上の自然数)連鎖なる(n+1)個の前記連関情報を抽出させ、
前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情が、前記n連鎖目の第(n+1)の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、
前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記(n+1)の連関情報までの(n+1)個の前記行動を、(n+1)個の前記連関情報が並べられた順序で行う行動と、前記第(n+1)の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成させ、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶させるプログラムを記憶したコンピュータ読み取り可能な記憶媒体。
The pre-behavior pre-behavior representing the behavior to be performed by the pseudo-living organism, which is realized by operating the pseudo-living organism that moves according to the desired motion pattern, and the situation before and after transition by the behavior A program for operating a simulated biological apparatus having association database means for storing a plurality of association information as a set of association information composed of external parameter values and internal parameter values and external parameter values and internal parameter values of the simulated creature after the action Is a storage medium that is stored so that it can be read by a computer,
The situation around the simulated organism is detected as an external parameter value,
Holding a pseudo emotion having at least the pleasant emotion of the pseudo organism as an internal parameter value;
Based on the similarity between the current external parameter value and internal parameter value of the simulated organism and the external parameter value and internal parameter value of the simulated organism before the action stored in the association database means, The association information that instructs the action to be performed is selected from the association database means ,
Based on the selected linkage information, make the pseudo creature act ,
Of the association information stored in the association database means, the first association information and the external parameter value and the internal parameter value of the simulated creature after the behavior of the first association information substantially coincide with each other before the behavior. N (n + 1) pieces of the linkage information are extracted in which n (where n is a natural number equal to or greater than 2) that is a chain of the second linkage information having the external parameter value and the internal parameter value of the pseudo-animal,
The pleasant parameter in the external parameter value and internal parameter value before the action of the first linkage information is the external parameter value of the pseudo creature after the action of the (n + 1) th linkage information in the n- th chain And lower than the pleasant feeling in the internal parameter value,
Wherein the external parameter value and intrinsic parameters of the pseudo organism before behavioral first association information, the action associated information to the (n + 1) number of the from the first association information the (n + 1), ( (n + 1) generation of the association information in the order in which the association information is arranged, and the external parameter value and the internal parameter value of the simulated creature after the behavior of the (n + 1) th association information are generated as a set of association information A computer-readable storage medium storing a program for storing the generated association information as association information if the association information is not stored in the association database means.
所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるコンピュータプログラムであって、
前記擬似生物周囲の状況を外部パラメータ値として検知させる機能と、
前記擬似生物の擬似的感情を内部パラメータ値として保持させる機能と、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させる機能と、
前記選択された連関情報に基づいて前記擬似生物に行動させる機能と、
前記選択された連関情報に基づいて行動させた後で検知された前記外部パラメータ値及び保持された前記内部パラメータ値と、前記選択された連関情報の前記行動後の外部パラメータ値及び内部パラメータ値との類似度を計算させる機能と、
前記類似度が所定値以上である場合は、前記選択された連関情報の前記遷移確率を増加させて、前記類似度が所定値未満である場合は、前記選択された連関情報の前記遷移確率を減少させる機能と、
を実現させるコンピュータプログラム。
The pre-behavior pre-behavior representing the behavior to be performed by the pseudo-living organism, which is realized by operating the pseudo-living organism that moves according to the desired motion pattern, and the situation before and after transition by the behavior External parameter value and internal parameter value, and external parameter value and internal parameter value of the simulated creature after the action, and a transition probability indicating how much the transition by the action is established. A computer program for operating a simulated biological apparatus having a plurality of association database means for storing association information ,
A function of detecting the situation around the simulated organism as an external parameter value;
A function of holding the pseudo-animated emotion as an internal parameter value;
The similarity between the current external parameter value and internal parameter value of the simulated creature, the external parameter value and internal parameter value of the simulated creature before the action stored in the association database means, and the transition probability of the action Based on the function that allows the association database means to select association information that instructs the simulated creature to perform an action ;
A function of causing the simulated creature to act based on the selected association information;
The external parameter value detected after acting based on the selected association information and the retained internal parameter value, and the external parameter value and internal parameter value after the behavior of the selected association information, A function to calculate the similarity of
When the similarity is greater than or equal to a predetermined value, the transition probability of the selected association information is increased, and when the similarity is less than a predetermined value, the transition probability of the selected association information is increased. With the ability to reduce,
A computer program that realizes
所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるコンピュータプログラムであって、
前記擬似生物周囲の状況を外部パラメータ値として検知させる機能と、
前記擬似生物の擬似的感情を内部パラメータ値として保持させる機能と、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させる機能と、
前記選択された連関情報に基づいて前記擬似生物に行動させる機能と、
前記選択された連関情報に基づいて行動させた後で検知された前記外部パラメータ値及び保持された前記内部パラメータ値と、前記選択された連関情報の前記行動後の外部パラメータ値及び内部パラメータ値との類似度を計算させる機能と、
前記類似度が所定値未満である場合は、前記選択された連関情報に基づいて行動させる前の前記外部パラメータ値及び内部パラメータ値、前記選択された連関情報の行動、この擬似生物の行動後の前記外部パラメータ値及び前記内部パラメータ値と、1回の試行で1回成功していることを表す遷移確率と、を一組とする連関情報を生成し、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶させる機能と、
を実現させるコンピュータプログラム。
The pre-behavior pre-behavior representing the behavior to be performed by the pseudo-living organism, which is realized by operating the pseudo-living organism that moves according to the desired motion pattern, and the situation before and after transition by the behavior External parameter value and internal parameter value, and external parameter value and internal parameter value of the simulated creature after the action, and a transition probability indicating how much the transition by the action is established. A computer program for operating a simulated biological apparatus having a plurality of association database means for storing association information ,
A function of detecting the situation around the simulated organism as an external parameter value;
A function of holding the pseudo-animated emotion as an internal parameter value;
The similarity between the current external parameter value and internal parameter value of the simulated creature, the external parameter value and internal parameter value of the simulated creature before the action stored in the association database means, and the transition probability of the action Based on the function that allows the association database means to select association information that instructs the simulated creature to perform an action ;
A function of causing the simulated creature to act based on the selected association information;
The external parameter value detected after acting based on the selected association information and the retained internal parameter value, and the external parameter value and internal parameter value after the behavior of the selected association information, A function to calculate the similarity of
When the similarity is less than a predetermined value, the external parameter value and the internal parameter value before acting based on the selected association information, the behavior of the selected association information, The association information is generated as a set of the external parameter value and the internal parameter value, and a transition probability indicating that the trial has succeeded once in one trial, and the generated association information is stored in the association database. If it is not stored in the means, the function to store as association information,
A computer program that realizes
所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるコンピュータプログラムであって、
前記擬似生物周囲の状況を外部パラメータ値として検知させる機能と、
前記擬似生物の擬似的感情を内部パラメータ値として保持させる機能と、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させる機能と、
前記選択された連関情報に基づいて前記擬似生物に行動させる機能と、
前記検知される外部パラメータ値から被検出体の行動を認識させ、
前記検知される外部パラメータ値を、被検出体に関する部分と、当該被検出体を除く環境部分に分解し、当該環境部分を当該被検出体の外部パラメータ値とし、
前記検知される外部パラメータ値に基づいて被検出体の内部パラメータ値を特定するための情報を記憶した辞書情報を用いて、前記認識された行動の前後に検知された外部パラメータ値から前記被検出体の内部パラメータ値を推定させ、
前記認識された行動と、当該行動の前後に検知された前記被検出体の外部パラメータ値と、当該行動の前後に検知された外部パラメータ値から前記辞書情報を用いて推定された前記被検出体の内部パラメータ値と、を一組の連関情報として生成させ、この生成された連関情報が前記連関データベース手段に記憶されていなければ記憶させる機能と、
を実現させるコンピュータプログラム。
The pre-behavior pre-behavior representing the behavior to be performed by the pseudo-living organism, which is realized by operating the pseudo-living organism that moves according to the desired motion pattern, and the situation before and after transition by the behavior A computer for operating a simulated biological apparatus having a plurality of linked database means as a set of linked information consisting of the external parameter value and the internal parameter value and the external parameter value and internal parameter value of the simulated creature after the action A program,
A function of detecting the situation around the simulated organism as an external parameter value;
A function of holding the pseudo-animated emotion as an internal parameter value;
Based on the similarity between the current external parameter value and internal parameter value of the simulated organism and the external parameter value and internal parameter value of the simulated organism before the action stored in the association database means, A function of selecting association information for instructing an action to be performed from the association database means ;
A function of causing the simulated creature to act based on the selected association information;
Recognize the action of the detected object from the detected external parameter value,
The detected external parameter value is decomposed into a part related to the detected object and an environmental part excluding the detected object, and the environmental part is set as an external parameter value of the detected object.
Using the dictionary information storing information for specifying the internal parameter value of the detected object based on the detected external parameter value, the detected object is detected from the external parameter value detected before and after the recognized action. Estimate the internal parameter values of the body,
The detected object estimated using the dictionary information from the recognized action, the external parameter value of the detected object detected before and after the action, and the external parameter value detected before and after the action A function of generating the internal parameter value as a set of association information, and storing the generated association information if it is not stored in the association database means;
A computer program that realizes
所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、当該行動による前記遷移がどのくらいの確率で成立するかを表す遷移確率と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるコンピュータプログラムであって、
前記擬似生物周囲の状況を外部パラメータ値として検知させる機能と、
前記擬似生物の擬似的感情を内部パラメータ値として保持させる機能と、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性と、当該行動の遷移確率に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させる機能と、
前記選択された連関情報に基づいて前記擬似生物に行動させる機能と、
前記連関データベース手段に記憶された前記連関情報から、行動後の外部パラメータ値及び内部パラメータ値が略同一のパラメータ値を有する複数の前記連関情報を抽出させ、
前記抽出された前記連関情報のうち、遷移確率が抽出された他の前記連関情報よりも下回る前記連関情報の前記行動前の前記外部パラメータ値及び内部パラメータ値を第1のパラメータ値とし、この他の前記連関情報の前記行動前の前記外部パラメータ値及び内部パラメータ値を第2のパラメータ値とし、前記第1のパラメータ値と、前記第1のパラメータ値を前記第2のパラメータ値へと変化させる行動と、前記第2のパラメータ値と、所定の初期値に設定された遷移確率と、を一組の連関情報として生成させ、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶させる機能と、
を実現させるコンピュータプログラム。
The pre-behavior pre-behavior representing the behavior to be performed by the pseudo-living organism, which is realized by operating the pseudo-living organism that moves according to the desired motion pattern, and the situation before and after transition by the behavior External parameter value and internal parameter value, and external parameter value and internal parameter value of the simulated creature after the action, and a transition probability indicating how much the transition by the action is established. A computer program for operating a simulated biological apparatus having a plurality of association database means for storing association information ,
A function of detecting the situation around the simulated organism as an external parameter value;
A function of holding the pseudo-animated emotion as an internal parameter value;
The similarity between the current external parameter value and internal parameter value of the simulated creature, the external parameter value and internal parameter value of the simulated creature before the action stored in the association database means, and the transition probability of the action Based on the function that allows the association database means to select association information that instructs the simulated creature to perform an action ;
A function of causing the simulated creature to act based on the selected association information;
From the association information stored in the association database means, extract a plurality of the association information having parameter values that are substantially the same as the external parameter value after the action and the internal parameter value,
Among the extracted the associated information, the external parameter value and the internal parameter value before the action of the associated information falls below the other of said associated information transition probability is extracted as a first parameter value, the other The external parameter value and the internal parameter value before the action of the association information are set as second parameter values, and the first parameter value and the first parameter value are changed to the second parameter value. An action, the second parameter value, and the transition probability set to a predetermined initial value are generated as a set of association information, and the generated association information is not stored in the association database means. A function to store as relation information,
A computer program that realizes
所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるコンピュータプログラムであって、
前記擬似生物周囲の状況を外部パラメータ値として検知させる機能と、
前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持させる機能と、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させる機能と、
前記選択された連関情報に基づいて前記擬似生物に行動させる機能と、
前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報と、を抽出させ、
前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情が、前記第2の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記第2の連関情報までの行動と、前記第2の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成させ、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶させる機能と、
を実現させるコンピュータプログラム。
The pre-behavior pre-behavior representing the behavior to be performed by the pseudo-living organism, which is realized by operating the pseudo-living organism that moves according to the desired motion pattern, and the situation before and after transition by the behavior A computer for operating a simulated biological apparatus having a plurality of linked database means as a set of linked information consisting of the external parameter value and the internal parameter value and the external parameter value and internal parameter value of the simulated creature after the action A program,
A function of detecting the situation around the simulated organism as an external parameter value;
A function of holding a pseudo emotion having at least the pleasant emotion of the pseudo organism as an internal parameter value;
Based on the similarity between the current external parameter value and internal parameter value of the simulated organism and the external parameter value and internal parameter value of the simulated organism before the action stored in the association database means, A function of selecting association information for instructing an action to be performed from the association database means ;
A function of causing the simulated creature to act based on the selected association information;
Of the association information stored in the association database means, the first association information and the external parameter value and the internal parameter value of the simulated creature after the behavior of the first association information substantially coincide with each other before the behavior. Second association information having external parameter values and internal parameter values of the simulated organism,
The pleasant feeling in the external parameter value and the internal parameter value of the simulated organism before the action of the first linkage information is the external parameter value and the internal parameter value of the simulated organism after the behavior of the second linkage information. when less than pleasantness, and the external parameter value and intrinsic parameters of the pseudo organism before the action the first association information, an action from the first association information to the second association information, the first The external parameter value and the internal parameter value of the simulated organism after the action of the two association information are generated as a set of association information, and if the generated association information is not stored in the association database means, the association information As a function to memorize as
A computer program that realizes
所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるコンピュータプログラムであって、
前記擬似生物周囲の状況を外部パラメータ値として検知させる機能と、
前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持させる機能と、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させる機能と、
前記選択された連関情報に基づいて前記擬似生物に行動させる機能と、
前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報と、この第2の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第3の連関情報とを抽出させ、
前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情が、前記第3の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記第2の連関情報の行動及び前記第2の連関情報から前記第3の連関情報までの行動と、前記第3の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成させ、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶させる機能と、
を実現させるコンピュータプログラム。
The pre-behavior pre-behavior representing the behavior to be performed by the pseudo-living organism, which is realized by operating the pseudo-living organism that moves according to the desired motion pattern, and the situation before and after transition by the behavior A computer for operating a simulated biological apparatus having a plurality of linked database means as a set of linked information consisting of the external parameter value and the internal parameter value and the external parameter value and internal parameter value of the simulated creature after the action A program,
A function of detecting the situation around the simulated organism as an external parameter value;
A function of holding a pseudo emotion having at least the pleasant emotion of the pseudo organism as an internal parameter value;
Based on the similarity between the current external parameter value and internal parameter value of the simulated organism and the external parameter value and internal parameter value of the simulated organism before the action stored in the association database means, A function of selecting association information for instructing an action to be performed from the association database means ;
A function of causing the simulated creature to act based on the selected association information;
Of the association information stored in the association database means, the first association information and the external parameter value and the internal parameter value of the simulated creature after the behavior of the first association information substantially coincide with each other before the behavior. The second association information having the external parameter value and the internal parameter value of the simulated creature, and the external parameter value and the internal parameter value of the simulated creature after the behavior of the second linkage information substantially match with each other before the behavior Extracting the third association information having the external parameter value and the internal parameter value of the pseudo-biology,
The pleasant feeling in the external parameter value and the internal parameter value of the pseudo organism before the action of the first linkage information is the external parameter value and the internal parameter value of the pseudo organism after the action of the third linkage information. when less than pleasantness, wherein the external parameter value and intrinsic parameters of the pseudo organism before behavioral first association information, the first from the association information activity and the second of said second association information an action from association information to said third linkage information, and the external parameter values and intrinsic parameters of the pseudo organism after action of the third association information, is generated as a set of association information, the generated A function for storing the association information if the association information is not stored in the association database means;
A computer program that realizes
所望の動作パタンによって運動する擬似生物を動作させ、前記動作パタンを組み合わせて実現される、前記擬似生物に行わせる行動と、当該行動により遷移する前後の状況を表す、当該行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値並びに当該行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、からなる一組の連関情報として、複数記憶する連関データベース手段を有する擬似生物装置を動作させるコンピュータプログラムであって、
前記擬似生物周囲の状況を外部パラメータ値として検知させる機能と、
前記擬似生物の快感情を少なくとも有する擬似的感情を内部パラメータ値として保持させる機能と、
現在の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記連関データベース手段に記憶された前記行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値との類似性に基づいて、前記擬似生物に行わせる行動を指示する連関情報を前記連関データベース手段から選択させる機能と、
前記選択された連関情報に基づいて前記擬似生物に行動させる機能と、
前記連関データベース手段に記憶される前記連関情報のうち、第1の連関情報と、この第1の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と略一致する、行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値を有する第2の連関情報とを1連鎖とするn(ただしnは2以上の自然数)連鎖なる(n+1)個の前記連関情報を抽出させ、
前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情が、前記n連鎖目の第(n+1)の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値における前記快感情よりも低いとき、
前記第1の連関情報の行動前の前記擬似生物の外部パラメータ値及び内部パラメータ値と、前記第1の連関情報から前記(n+1)の連関情報までの(n+1)個の前記行動を、(n+1)個の前記連関情報が並べられた順序で行う行動と、前記第(n+1)の連関情報の行動後の前記擬似生物の外部パラメータ値及び内部パラメータ値と、を一組の連関情報として生成させ、この生成された連関情報が前記連関データベース手段に記憶されていなければ連関情報として記憶させる機能と、
を実現させるコンピュータプログラム。
The pre-behavior pre-behavior representing the behavior to be performed by the pseudo-living organism, which is realized by operating the pseudo-living organism that moves according to the desired motion pattern, and the situation before and after transition by the behavior A computer for operating a simulated biological apparatus having a plurality of linked database means as a set of linked information consisting of the external parameter value and the internal parameter value and the external parameter value and internal parameter value of the simulated creature after the action A program,
A function of detecting the situation around the simulated organism as an external parameter value;
A function of holding a pseudo emotion having at least the pleasant emotion of the pseudo organism as an internal parameter value;
Based on the similarity between the current external parameter value and internal parameter value of the simulated organism and the external parameter value and internal parameter value of the simulated organism before the action stored in the association database means, A function of selecting association information for instructing an action to be performed from the association database means ;
A function of causing the simulated creature to act based on the selected association information;
Of the association information stored in the association database means, the first association information and the external parameter value and the internal parameter value of the simulated creature after the behavior of the first association information substantially coincide with each other before the behavior. N (n + 1) pieces of the linkage information are extracted in which n (where n is a natural number equal to or greater than 2) that is a chain of the second linkage information having the external parameter value and the internal parameter value of the pseudo-animal,
The pleasant parameter in the external parameter value and internal parameter value before the action of the first linkage information is the external parameter value of the pseudo creature after the action of the (n + 1) th linkage information in the n- th chain And lower than the pleasant feeling in the internal parameter value,
Wherein the outer parameter values and intrinsic parameters of the pseudo organism before behavioral first association information, the action associated information to the (n + 1) number of the from the first association information the (n + 1), ( (n + 1) generation of the association information in the order in which the association information is arranged, and the external parameter value and the internal parameter value of the simulated creature after the behavior of the (n + 1) th association information are generated as a set of association information A function of storing the generated association information as association information if the association database means is not stored;
A computer program that realizes
JP2000363303A 2000-11-29 2000-11-29 Pseudo-biological device, pseudo-biological behavior formation method in pseudo-biological device, and computer-readable storage medium describing program for causing pseudo-biological device to perform behavior formation Expired - Fee Related JP3854061B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000363303A JP3854061B2 (en) 2000-11-29 2000-11-29 Pseudo-biological device, pseudo-biological behavior formation method in pseudo-biological device, and computer-readable storage medium describing program for causing pseudo-biological device to perform behavior formation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000363303A JP3854061B2 (en) 2000-11-29 2000-11-29 Pseudo-biological device, pseudo-biological behavior formation method in pseudo-biological device, and computer-readable storage medium describing program for causing pseudo-biological device to perform behavior formation

Publications (2)

Publication Number Publication Date
JP2002163631A JP2002163631A (en) 2002-06-07
JP3854061B2 true JP3854061B2 (en) 2006-12-06

Family

ID=18834431

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000363303A Expired - Fee Related JP3854061B2 (en) 2000-11-29 2000-11-29 Pseudo-biological device, pseudo-biological behavior formation method in pseudo-biological device, and computer-readable storage medium describing program for causing pseudo-biological device to perform behavior formation

Country Status (1)

Country Link
JP (1) JP3854061B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11294383B2 (en) * 2016-08-12 2022-04-05 Lg Electronics Inc. Self-learning robot

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4042108B2 (en) 2003-02-19 2008-02-06 ソニー株式会社 Robot apparatus and control method thereof
JP7247560B2 (en) * 2018-12-04 2023-03-29 カシオ計算機株式会社 Robot, robot control method and program
US20220088788A1 (en) * 2019-02-15 2022-03-24 Sony Group Corporation Moving body, moving method
JPWO2021085175A1 (en) * 2019-11-01 2021-05-06
JPWO2022113771A1 (en) * 2020-11-26 2022-06-02
JP7312511B1 (en) * 2023-02-17 2023-07-21 独立行政法人国立高等専門学校機構 Behavior control method, behavior control program, behavior control device, and communication robot

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11294383B2 (en) * 2016-08-12 2022-04-05 Lg Electronics Inc. Self-learning robot

Also Published As

Publication number Publication date
JP2002163631A (en) 2002-06-07

Similar Documents

Publication Publication Date Title
US6714840B2 (en) User-machine interface system for enhanced interaction
CN102473320B (en) Bringing a visual representation to life via learned input from the user
CN108463271B (en) System and method for motor skill analysis and skill enhancement and prompting
US7117190B2 (en) Robot apparatus, control method thereof, and method for judging character of robot apparatus
KR100864339B1 (en) Robot device and behavior control method for robot device
JP2003039363A (en) Robot device, action learning method therefor, action learning program thereof, and program recording medium
US8321221B2 (en) Speech communication system and method, and robot apparatus
JP4985805B2 (en) Robot apparatus and operation control method
JP3211186B2 (en) Robot, robot system, robot learning method, robot system learning method, and recording medium
US20030182122A1 (en) Robot device and control method therefor and storage medium
US6362589B1 (en) Robot apparatus
JP3178393B2 (en) Action generation device, action generation method, and action generation program recording medium
KR20010053481A (en) Robot device and method for controlling the same
JP7205148B2 (en) ROBOT, CONTROL METHOD AND PROGRAM
US20230173683A1 (en) Behavior control device, behavior control method, and program
JP2001191281A (en) Editing device, editing method, and storage medium
JP3854061B2 (en) Pseudo-biological device, pseudo-biological behavior formation method in pseudo-biological device, and computer-readable storage medium describing program for causing pseudo-biological device to perform behavior formation
WO2021049254A1 (en) Information processing method, information processing device, and program
KR102171428B1 (en) Dancing Robot that learns the relationship between dance and music
CN114712862A (en) Virtual pet interaction method, electronic device and computer-readable storage medium
Patil et al. Dynamical perceptual-motor primitives for better deep reinforcement learning agents
JP2002219677A (en) Robot system, and method of controlling behavior of robot system
JP2003340760A (en) Robot device and robot control method, recording medium and program
JP2001157982A (en) Robot device and control method thereof
CN114118434A (en) Intelligent robot and learning method thereof

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060214

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060905

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060907

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090915

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100915

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110915

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees