JP5908350B2 - 行動制御システム - Google Patents
行動制御システム Download PDFInfo
- Publication number
- JP5908350B2 JP5908350B2 JP2012140256A JP2012140256A JP5908350B2 JP 5908350 B2 JP5908350 B2 JP 5908350B2 JP 2012140256 A JP2012140256 A JP 2012140256A JP 2012140256 A JP2012140256 A JP 2012140256A JP 5908350 B2 JP5908350 B2 JP 5908350B2
- Authority
- JP
- Japan
- Prior art keywords
- state variable
- probability
- subtask
- arithmetic processing
- processing element
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1628—Programme controls characterised by the control loop
- B25J9/163—Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1602—Programme controls characterised by the control system, structure, architecture
- B25J9/161—Hardware, e.g. neural networks, fuzzy logic, interfaces, processor
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/33—Director till display
- G05B2219/33054—Control agent, an active logical entity that can control logical objects
Description
図1に示されている行動制御システム10は、エージェント1に搭載されているアクチュエータの動作を制御することにより、当該エージェント1の行動を制御するように構成されている。行動制御システム10は、例えば、エージェント1に搭載されている電子制御ユニット(CPU,ROM,RAM,I/O回路等により構成されている。)又はコンピュータにより構成されている。
前記構成の行動制御システム10により、エージェント1とオブジェクト2との相互作用を伴う複数の異なるサブタスクをエージェント1に選択的に実行させるように制御演算処理が実行される。
複数のサブタスクとして、エージェント1としてのアームロボットの先端部に取り付けられているエンドエフェクタにより、xy座標系においてオブジェクト2を+x方向に所定量だけ動かす第1サブタスクと、オブジェクト2を+y方向に所定量だけ動かす第2サブタスクとが採用される(図2(a)(b)参照)。オブジェクト2の初期状態はxy座標系の原点座標値(0,0)により定義されている。
確率遷移モデルは、表1に示されているオブジェクト2の状態変数及び表2に示されている実行サブタスクを表わす変数により定義されている。
行動制御システム10の演算処理負荷軽減の観点から、第1サブタスクが実行された後、第2サブタスクが実行されるという規則にしたがって、オブジェクト2の状態変数(x,y)を図4(a)〜(c)の右側に示されているゴール(サブゴール)Goalに到達させるための状態変数軌道が計算された。
第1サブタスク(roll)は、第1床面に置かれているオブジェクト2の下面(底面)の一辺を軸線として、当該下面を第1床面から持ち上げるように当該オブジェクト2を傾動させるタスクである(図5(a)参照)。「床面」とは、建造物等の床面に限定されず、机上面、路面又は地面等のあらゆる構造物の上面を意味する。
確率遷移モデルは、表3に示されているオブジェクト2の状態変数及び表4に示されている実行サブタスクを表わす変数により定義されている。
R(k)={rij}, r11=cosδθ, r12=-sinδθ, r21=sinδθ, r22=cosδθ ..(201)。
=N(R(k){Pc(k)-Pp(k)}+Pp(k)+S2δP(k+1), ΣPc) ..(211)。
=N(R(k){Pg(k)-Pp(k)}+Pp(k)+S2δP(k+1), ΣPg) ..(212)。
=N((1-S3)Pp(k)+S3Pe(k)+S2δP(k+1),ΣPp) ..(213)。
P(fz(k)|mg,μ,Pc(k),Pg(k),Pp(k),Pe(k))=N(mg(xc-xg)/{xc-xp+μ(zc-zp)}-mg,Σfz) ..(216)。
行動制御システム10の演算処理負荷軽減の観点から、第1サブタスクが実行された後、第2サブタスクが実行され、第2サブタスクが実行された後、第3サブタスクが実行され、第3サブタスクが実行された後、第4サブタスクが実行されるという規則にしたがって、オブジェクト2の状態変数を図5(d)に示されているゴール(サブゴール)Goalに到達させるための状態変数軌道が計算された。
前記構成の行動制御システム10によれば、ディリクレ分布により確率分布が表現されている複数のサブタスクのそれぞれの実行確率qiに応じて、オブジェクト2の状態変数の遷移態様が定まるように定義されている確率遷移モデル(図3及び図6参照)にしたがって、当該状態変数の時系列である複数の状態変数軌道が生成される(図2(a)(b)参照)。これにより、ディリクレ分布の時系列的な変化態様の相違に応じて、エージェント1により選択的に実行されるサブタスクのさまざまな変化態様が勘案された形で複数の状態変数軌道が生成される。
第1演算処理要素11が、複数のサブタスクのそれぞれの実行確率に加えて、オブジェクト2の環境因子に応じて状態変数の遷移態様が定まるような確率遷移モデルであって、環境因子が異なる複数の確率遷移モデルのそれぞれにしたがって、複数の状態変数軌道を生成するように構成されている。第2演算処理要素12が、第1演算処理要素11により生成された複数の状態変数軌道のうち確率遷移モデル全体の結合確率を最大化又は最適化する1つの状態変数軌道の生成基礎となった1つの確率遷移モデルにおける環境因子を実際の環境因子として推定するように構成されている。
Claims (2)
- エージェントにオブジェクトを対象とする複数のサブタスクを選択的に実行させるように当該エージェントの行動を制御するシステムであって、
前記オブジェクトの状態変数が確率変数として表現され、かつ、ディリクレ分布により確率分布が表現されている前記複数のサブタスクのそれぞれの実行確率に応じて当該状態変数の遷移態様が定まるような確率遷移モデルにしたがって、前記オブジェクトの状態変数の時系列を表わす複数の状態変数軌道を生成するように構成されている第1演算処理要素と、
前記第1演算処理要素により生成された前記複数の状態変数軌道のうち、前記確率遷移モデル全体の結合確率を最大化又は最適化する1つの状態変数軌道である目標状態変数軌道にしたがって前記オブジェクトの状態が遷移するように、前記エージェントの動作を制御するように構成されている第2演算処理要素と、を備え、
前記第1演算処理要素が、前記複数のサブタスクのそれぞれの実行確率に加えて、前記オブジェクトの環境因子に応じて前記状態変数の遷移態様が定まるような確率遷移モデルであって、前記環境因子が異なる複数の確率遷移モデルのそれぞれにしたがって、前記複数の状態変数軌道を生成するように構成され、
前記第2演算処理要素が、前記第1演算処理要素により生成された前記複数の状態変数軌道のうち、前記確率遷移モデル全体の結合確率を最大化又は最適化する1つの状態変数軌道の生成基礎となった1つの確率遷移モデルにおける環境因子を実際の環境因子として推定するように構成されていることを特徴とする行動制御システム。 - 請求項1記載の行動制御システムにおいて、
前記第1演算処理要素が、前記複数のサブタスクのうち実行順位が第i位(i=1,2,‥)のサブタスク及び第i+1位のサブタスクのそれぞれの実行確率に応じて前記状態変数の遷移態様が定まるような第i確率遷移モデルにしたがって、前記オブジェクトの状態変数の時系列を表わす複数の第i状態変数軌道を生成するように構成され、
前記第2演算処理要素が、前記第1演算処理要素により生成された前記複数の第i状態変数軌道のうち、前記第i確率遷移モデル全体の結合確率を最大化又は最適化する1つの第i状態変数軌道を第i目標状態変数軌道として生成するとともに、前記第i目標状態変数軌道の接続軌道を前記目標状態変数軌道として生成するように構成されていることを特徴とする行動制御システム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012140256A JP5908350B2 (ja) | 2012-06-21 | 2012-06-21 | 行動制御システム |
US13/774,380 US9014852B2 (en) | 2012-06-21 | 2013-02-22 | Behavior control system |
DE102013203287.0A DE102013203287B4 (de) | 2012-06-21 | 2013-02-27 | Verhaltenssteuerungssystem |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012140256A JP5908350B2 (ja) | 2012-06-21 | 2012-06-21 | 行動制御システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014004640A JP2014004640A (ja) | 2014-01-16 |
JP5908350B2 true JP5908350B2 (ja) | 2016-04-26 |
Family
ID=49713838
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012140256A Active JP5908350B2 (ja) | 2012-06-21 | 2012-06-21 | 行動制御システム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9014852B2 (ja) |
JP (1) | JP5908350B2 (ja) |
DE (1) | DE102013203287B4 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5867737B2 (ja) * | 2013-01-17 | 2016-02-24 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
US10898999B1 (en) * | 2017-09-18 | 2021-01-26 | X Development Llc | Selective human-robot interaction |
JP7207207B2 (ja) * | 2019-07-09 | 2023-01-18 | トヨタ自動車株式会社 | 演算装置、機械学習方法及び制御プログラム |
DE102020103854B4 (de) | 2020-02-14 | 2022-06-15 | Franka Emika Gmbh | Maschinelles Lernen einer erfolgreich abgeschlossenen Roboteranwendung |
US20220305649A1 (en) * | 2021-03-25 | 2022-09-29 | Naver Corporation | Reachable manifold and inverse mapping training for robots |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003090979A (ja) | 2001-09-18 | 2003-03-28 | Nikon Corp | 接眼光学系および該光学系を備えた画像表示装置 |
JP3714276B2 (ja) | 2002-04-25 | 2005-11-09 | 株式会社日立製作所 | ディジタル信号の受信方法及び装置 |
JP2006285899A (ja) | 2005-04-05 | 2006-10-19 | Sony Corp | 学習装置および学習方法、生成装置および生成方法、並びにプログラム |
JP2007011571A (ja) * | 2005-06-29 | 2007-01-18 | Advanced Telecommunication Research Institute International | 情報処理装置、およびプログラム |
JP5141876B2 (ja) * | 2007-09-12 | 2013-02-13 | 株式会社国際電気通信基礎技術研究所 | 軌道探索装置 |
US8290885B2 (en) | 2008-03-13 | 2012-10-16 | Sony Corporation | Information processing apparatus, information processing method, and computer program |
DE102008020380B4 (de) | 2008-04-23 | 2010-04-08 | Siemens Aktiengesellschaft | Verfahren zum rechnergestützten Lernen einer Steuerung und/oder Regelung eines technischen Systems |
JP5313562B2 (ja) | 2008-06-27 | 2013-10-09 | 本田技研工業株式会社 | 行動制御システム |
JP5329856B2 (ja) | 2008-06-27 | 2013-10-30 | 本田技研工業株式会社 | 行動推定システム |
EP2296062B1 (de) | 2009-09-09 | 2021-06-23 | Siemens Aktiengesellschaft | Verfahren zum rechnergestützten Lernen einer Steuerung und/oder Regelung eines technischen Systems |
JP5446788B2 (ja) * | 2009-11-30 | 2014-03-19 | コニカミノルタ株式会社 | 情報処理装置及びプログラム |
JP5489965B2 (ja) | 2009-12-24 | 2014-05-14 | 本田技研工業株式会社 | 行動制御システムおよびロボット |
EP2363251A1 (en) | 2010-03-01 | 2011-09-07 | Honda Research Institute Europe GmbH | Robot with Behavioral Sequences on the basis of learned Petri Net Representations |
JP5552710B2 (ja) * | 2010-11-25 | 2014-07-16 | 株式会社国際電気通信基礎技術研究所 | ロボットの移動制御システム、ロボットの移動制御プログラムおよびロボットの移動制御方法 |
-
2012
- 2012-06-21 JP JP2012140256A patent/JP5908350B2/ja active Active
-
2013
- 2013-02-22 US US13/774,380 patent/US9014852B2/en active Active
- 2013-02-27 DE DE102013203287.0A patent/DE102013203287B4/de active Active
Also Published As
Publication number | Publication date |
---|---|
US20130345865A1 (en) | 2013-12-26 |
DE102013203287B4 (de) | 2016-01-21 |
US9014852B2 (en) | 2015-04-21 |
DE102013203287A1 (de) | 2013-12-24 |
JP2014004640A (ja) | 2014-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5908350B2 (ja) | 行動制御システム | |
Nguyen-Tuong et al. | Model learning for robot control: a survey | |
Berenson | Manipulation of deformable objects without modeling and simulating deformation | |
US11878415B2 (en) | Tactile dexterity and control | |
Goury et al. | Real-time simulation for control of soft robots with self-collisions using model order reduction for contact forces | |
Iacca et al. | Memory-saving memetic computing for path-following mobile robots | |
US20210362331A1 (en) | Skill templates for robotic demonstration learning | |
JP2009099082A (ja) | 力学シミュレーション装置及び力学シミュレーション方法、並びにコンピュータ・プログラム | |
KR20220080080A (ko) | 동적 계획 제어기 | |
Decré et al. | Extending the iTaSC constraint-based robot task specification framework to time-independent trajectories and user-configurable task horizons | |
US11904473B2 (en) | Transformation mode switching for a real-time robotic control system | |
Mazare et al. | Adaptive variable impedance control for a modular soft robot manipulator in configuration space | |
Bös et al. | Iteratively learned and temporally scaled force control with application to robotic assembly in unstructured environments | |
Zanchettin et al. | Robust constraint-based control of robot manipulators: An application to a visual aided grasping task | |
US20220375210A1 (en) | Method for controlling a robotic device | |
WO2021231242A1 (en) | Accelerating robotic planning for operating on deformable objects | |
Shirai et al. | Robust pivoting manipulation using contact implicit bilevel optimization | |
WO2021236506A1 (en) | Distributed robotic demonstration learning | |
US20210362329A1 (en) | Integrating sensor streams for robotic demonstration learning | |
Han et al. | DeepSnake: Sequence learning of joint torques using a gated recurrent neural network | |
Sun et al. | A Fuzzy Cluster-based Framework for Robot-Environment Collision Reaction | |
Lahariya et al. | Learning physics-informed simulation models for soft robotic manipulation: A case study with dielectric elastomer actuators | |
Yip et al. | Performance analysis of a manipulation task in time-delayed teleoperation | |
Mohtat et al. | Energy-consistent force feedback laws for virtual environments | |
JP7435815B2 (ja) | 動作指令生成装置、動作指令生成方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141127 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151008 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160107 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160301 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160323 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5908350 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |