JP5183665B2 - ロボットの少なくとも1つの将来的活動を決定する決定メカニズム、方法、モジュールおよび決定するように構成されたロボット - Google Patents
ロボットの少なくとも1つの将来的活動を決定する決定メカニズム、方法、モジュールおよび決定するように構成されたロボット Download PDFInfo
- Publication number
- JP5183665B2 JP5183665B2 JP2010087108A JP2010087108A JP5183665B2 JP 5183665 B2 JP5183665 B2 JP 5183665B2 JP 2010087108 A JP2010087108 A JP 2010087108A JP 2010087108 A JP2010087108 A JP 2010087108A JP 5183665 B2 JP5183665 B2 JP 5183665B2
- Authority
- JP
- Japan
- Prior art keywords
- robot
- program
- activity
- state
- probabilistic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Feedback Control In General (AREA)
- Manipulator (AREA)
- Image Analysis (AREA)
Description
・前の環境状態の前の確率論的表現を計算し、
・前記少なくとも1つの将来的活動が適用された後に、達成すべき後の環境状態の後の確率論的表現における少なくとも1つの不確定性を低減する新たな観察(または測定)を目的として、前記前の確率論的表現を更新し、
ただし前記後の確率論的表現は前記更新から生じた確率論的表現であり、
・前記前の確率論的表現と前記後の確率論的表現との間の情報利得を、少なくとも1つの情報理論的測定を使用して決定し、そして
・前記少なくとも1つの将来的活動を、当該少なくとも1つの将来的活動の実行コストを前記情報利得に加算することにより評価することによって決定するように構成されている。
・前記少なくとも1つの将来的活動を適用することにより、時間的に前の環境状態から前記時間的に後の環境状態に達する際に発生する状態変化不確定性、
および/または
・前記時間的に後の環境状態で実行される測定を妨害する測定ノイズ。
・前の環境状態の前の確率論的表現を計算し、
・前記少なくとも1つの将来的活動が適用された後に、達成すべき後の環境状態の後の確率論的表現における少なくとも1つの不確定性を低減する新たな観察(または測定)を目的にして前記前の確率論的表現を更新し、
ただし前記後の確率論的表現は前記更新から生じた確率論的表現であり、
・前記前の確率論的表現と前記後の確率論的表現との間の情報利得を、少なくとも1つの情報理論的測定を使用して決定し、
・前記少なくとも1つの将来的活動を、当該少なくとも1つの将来的活動の実行コストを前記情報利得に加算することにより評価することによって決定するように構成されている。
・上に概略を示し、以下に詳細に説明する決定メカニズム、または
・上に概略を示し、以下に詳細に説明するアクティブ型認識モジュール。
・前の環境状態の前の確率論的表現を計算し、
・前記少なくとも1つの将来的活動が適用された後に、達成すべき後の環境状態の後の確率論的表現における少なくとも1つの不確定性を低減する新たな観察を目的として、前記前の確率論的表現を更新し、
ただし前記後の確率論的表現は前記更新から生じた確率論的表現であり、
・前記前の確率論的表現と前記後の確率論的表現との間の情報利得を、少なくとも1つの情報理論的測定を使用して決定し、
・前記少なくとも1つの将来的活動を、当該少なくとも1つの将来的活動の実行コストを前記情報利得に加算することにより評価することによって決定するように構成されている。本発明は、ロボットのための改善された活動プランニングを提供し、ロボットの活動のためにシーンまたは環境の探索を実行および/または要求する種々異なるロボットに実現することができる。
Claims (21)
- ロボット(11)にシーンを自立的に探索させ、かつ、前記ロボット(11)の少なくとも1つの将来的活動(a)を、前記ロボット(11)の複数の活動(a)から、次のステップを用いて決定するための、コンピュータに実行させるアクティブ型認識プログラム(21)であって、
・前の環境状態(q)の前の確率論的表現を計算(212)するステップと、
・前記少なくとも1つの将来的活動(a)が適用された後に、達成すべき後の環境状態(q’)の後の確率論的表現における少なくとも1つの不確定性を低減することについての新たな観察(O)を目的として、前記前の確率論的表現を更新(212)するステップと、
ただし前記後の確率論的表現は前記更新(212)から生じた確率論的表現であり、
・前記前の確率論的表現と前記後の確率論的表現との間の情報利得を、少なくとも1つの情報理論的測定を使用して決定(214)するステップと、そして
・前記少なくとも1つの将来的活動(a)を、当該少なくとも1つの将来的活動(a)の実行コストを前記情報利得に加算することにより評価するステップと、
ただし、前記少なくとも1つの将来的活動(a)を評価するステップは、実行期間において前記少なくとも1つの将来的活動の実行コストを評価し、当該実行期間の終わりにおいて前記情報利得を評価するステップを含む、
の各ステップをコンピュータに実行させるためのアクティブ型認識プログラム(21)。 - 前記少なくとも1つの将来的活動(a)は、前記ロボット(11)のセンサの位置変更を要求するロボット操作命令である請求項1記載のプログラム。
- 前記プログラムは、前記ロボット(11)の将来的活動(a)のシーケンスを評価するように構成されている請求項1または2に記載のプログラム。
- 前記少なくとも1つの不確定性は、
・前記少なくとも1つの将来的活動(a)を適用することにより、時間的に前の環境状態(q)から前記時間的に後の環境状態(q’)に達する際に発生する状態変化不確定性、および/または
・前記時間的に後の環境状態(q’)で実行される測定を妨害する測定ノイズである請求項1から3までのいずれか1項に記載のプログラム。 - 前記プログラムは、前記更新(21)をベイズフィルタで実行するように構成されている請求項1から4までのいずれか1項に記載のプログラム。
- 前記少なくとも1つの情報理論的測定は、確率論的表現に基づくエントロピーである請求項1から5までのいずれか1項に記載のプログラム。
- 前記決定(214)は、前記前の確率論的表現の前のエントロピーと、前記後の確率論的表現の予測されるエントロピーとの間の差を決定することを含む請求項1から6までのいずれか1項に記載のプログラム。
- 前記更新(212)は、前記少なくとも1つの将来的活動を実行した後に得られる新たな観察の評価を含む請求項1から7までのいずれか1項に記載のプログラム。
- 前記更新(212)は、前記評価を使用することによって、前記少なくとも1つの将来的活動(a)に対する前記後の環境状態(q’)の前記後の確率論的表現の予測を含む請求項8記載のプログラム。
- 前記前の確率論的表現と前記後の確率論的表現は、多変量ガウス混合分布である請求項1から9までのいずれか1項に記載のプログラム。
- 前記少なくとも1つの不確定性は、前記後の確率論的表現の微分エントロピーを上限評価によって近似することにより決定される状態不確定性である請求項1から10までのいずれか1項に記載のプログラム。
- 前記プログラムは、前記少なくとも1つの将来的活動(a)の実行後に前記情報利得が最大であり、かつ前記少なくとも1つの将来的活動(a)の実行コストと前記不確定性が低減される場合に、前記少なくとも1つの将来的活動(a)を決定するように構成されている請求項1から11までのいずれか1項に記載のプログラム。
- 前記プログラムは、所望の品質基準に達した場合、前記決定を終了するように構成されている請求項1から12までのいずれか1項に記載のプログラム。
- 前記所望の品質基準は、少なくとも1つの分布エントロピーの形態で提供される請求項13記載のプログラム。
- 前記前の確率論的表現と前記後の確率論的表現は、POMDPコンセプトを使用することにより特定されるモデル(211)の使用によって計算される請求項1から14までのいずれか1項に記載のプログラム。
- 前記前の環境状態(q)と前記後の環境状態(q’)は少なくとも1つのオブジェクト(31,32,33,34)の状態を記述し、
前記少なくとも1つのオブジェクト(31,32,33,34)は、当該少なくとも1つのオブジェクト(31,32,33,34)のクラスの離散的クラス表現と、当該少なくとも1つのオブジェクト(31,32,33,34)の連続的なm次元ポーズを含む請求項1から15までのいずれか1項に記載のプログラム。 - 前記前の環境状態(q)と前記後の環境状態(q’)は、シーンに配置された少なくとも1つのオブジェクト(31,32,33,34)を含む当該シーンの状態を参照し、前記状態における前記少なくとも1つのオブジェクト(31,32,33,34)のフィーチャの視認性を決定する請求項1から16までのいずれか1項に記載のプログラム。
- 前記新たな観察は、シーンの少なくとも1つのオブジェクト(31,32,33,34)のフィーチャ集合を求めることである請求項1から17までのいずれか1項に記載のプログラム。
- 動作のために、請求項1から18までのいずれか1項に記載のプログラムが実行される、ロボット(11)。
- シーンの画像取得のための立体カメラシステムを有する、請求項19に記載のロボット(11)。
- サービスロボットである、請求項19または20に記載のロボット(11)。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP09004982.6 | 2009-04-03 | ||
EP09004982 | 2009-04-03 | ||
EP09011666A EP2249292A1 (en) | 2009-04-03 | 2009-09-11 | Decision making mechanism, method, module, and robot configured to decide on at least one prospective action of the robot |
EP09011666.6 | 2009-09-11 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2010244549A JP2010244549A (ja) | 2010-10-28 |
JP2010244549A5 JP2010244549A5 (ja) | 2012-07-26 |
JP5183665B2 true JP5183665B2 (ja) | 2013-04-17 |
Family
ID=42607745
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010087108A Expired - Fee Related JP5183665B2 (ja) | 2009-04-03 | 2010-04-05 | ロボットの少なくとも1つの将来的活動を決定する決定メカニズム、方法、モジュールおよび決定するように構成されたロボット |
Country Status (3)
Country | Link |
---|---|
US (1) | US8583284B2 (ja) |
EP (1) | EP2249292A1 (ja) |
JP (1) | JP5183665B2 (ja) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9015093B1 (en) * | 2010-10-26 | 2015-04-21 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
KR20120047577A (ko) * | 2010-11-04 | 2012-05-14 | 주식회사 케이티 | 대화형 행동모델을 이용한 로봇 인터랙션 서비스 제공 장치 및 방법 |
US8942917B2 (en) | 2011-02-14 | 2015-01-27 | Microsoft Corporation | Change invariant scene recognition by an agent |
US8768071B2 (en) | 2011-08-02 | 2014-07-01 | Toyota Motor Engineering & Manufacturing North America, Inc. | Object category recognition methods and robots utilizing the same |
JP2013058120A (ja) * | 2011-09-09 | 2013-03-28 | Sony Corp | 情報処理装置、情報処理方法、及び、プログラム |
US9300531B2 (en) | 2011-12-12 | 2016-03-29 | Openet Telecom Ltd. | Systems, devices, and methods of orchestration and application of business rules for real-time control of subscribers in a telecommunications operator's network |
US9384448B2 (en) * | 2011-12-28 | 2016-07-05 | General Electric Company | Action-based models to identify learned tasks |
KR101919831B1 (ko) | 2012-01-11 | 2018-11-19 | 삼성전자주식회사 | 오브젝트 인식 장치, 분류 트리 학습 장치 및 그 동작 방법 |
US8447419B1 (en) | 2012-05-02 | 2013-05-21 | Ether Dynamics Corporation | Pseudo-genetic meta-knowledge artificial intelligence systems and methods |
US10572774B2 (en) * | 2012-12-06 | 2020-02-25 | Toyota Motor Engineering & Manufacturing North America. Inc. | Methods and robots for adjusting object detection parameters, object recognition parameters, or both object detection parameters and object recognition parameters |
CN103810700B (zh) * | 2014-01-14 | 2017-01-11 | 燕山大学 | 基于深度图像利用遮挡信息确定下一最佳观测方位的方法 |
JP2015136762A (ja) * | 2014-01-23 | 2015-07-30 | セイコーエプソン株式会社 | 処理装置、ロボット、ロボットシステム及び処理方法 |
JP6240689B2 (ja) | 2015-07-31 | 2017-11-29 | ファナック株式会社 | 人の行動パターンを学習する機械学習装置、ロボット制御装置、ロボットシステム、および機械学習方法 |
DE102016009030B4 (de) | 2015-07-31 | 2019-05-09 | Fanuc Corporation | Vorrichtung für maschinelles Lernen, Robotersystem und maschinelles Lernsystem zum Lernen eines Werkstückaufnahmevorgangs |
JP6522488B2 (ja) * | 2015-07-31 | 2019-05-29 | ファナック株式会社 | ワークの取り出し動作を学習する機械学習装置、ロボットシステムおよび機械学習方法 |
US10839302B2 (en) | 2015-11-24 | 2020-11-17 | The Research Foundation For The State University Of New York | Approximate value iteration with complex returns by bounding |
FR3044438A1 (fr) * | 2015-11-27 | 2017-06-02 | Thales Sa | Systeme et procede d'aide a la decision |
CN106446930B (zh) * | 2016-06-28 | 2019-11-22 | 沈阳工业大学 | 基于深层卷积神经网络的机器人工作场景识别方法 |
US10083369B2 (en) * | 2016-07-01 | 2018-09-25 | Ricoh Company, Ltd. | Active view planning by deep learning |
US11176473B2 (en) * | 2017-01-06 | 2021-11-16 | International Business Machines Corporation | Partially observed Markov decision process model and its use |
CN109974699B (zh) * | 2017-12-27 | 2021-08-27 | 深圳市优必选科技有限公司 | 一种机器人及其地图自主探索方法和装置 |
DE102018216561A1 (de) * | 2018-09-27 | 2020-04-02 | Robert Bosch Gmbh | Verfahren, Vorrichtung und Computerprogramm zum Ermitteln einer Strategie eines Agenten |
US20220083884A1 (en) * | 2019-01-28 | 2022-03-17 | Mayo Foundation For Medical Education And Research | Estimating latent reward functions from experiences |
JP2020149162A (ja) * | 2019-03-11 | 2020-09-17 | 富士通株式会社 | 情報処理装置、画像処理プログラム及び画像処理方法 |
JP7337611B2 (ja) * | 2019-09-06 | 2023-09-04 | 株式会社東芝 | 把持装置、荷役装置、及び制御装置 |
CN111814915B (zh) * | 2020-08-26 | 2020-12-25 | 中国科学院自动化研究所 | 多智能体时空特征提取方法及系统、行为决策方法及系统 |
CN113269315B (zh) * | 2021-06-29 | 2024-04-02 | 安徽寒武纪信息科技有限公司 | 利用深度强化学习执行任务的设备、方法及可读存储介质 |
CN116922397B (zh) * | 2023-09-13 | 2023-11-28 | 成都明途科技有限公司 | 机器人智能水平的测量方法、装置、机器人及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5179441A (en) * | 1991-12-18 | 1993-01-12 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Near real-time stereo vision system |
US7827011B2 (en) * | 2005-05-03 | 2010-11-02 | Aware, Inc. | Method and system for real-time signal classification |
US20060282021A1 (en) * | 2005-05-03 | 2006-12-14 | Devaul Richard W | Method and system for fall detection and motion analysis |
US20100138366A1 (en) * | 2007-07-02 | 2010-06-03 | Qin Zhang | System and method for information processing and motor control |
US8559699B2 (en) * | 2008-10-10 | 2013-10-15 | Roboticvisiontech Llc | Methods and apparatus to facilitate operations in image based systems |
-
2009
- 2009-09-11 EP EP09011666A patent/EP2249292A1/en not_active Withdrawn
-
2010
- 2010-04-02 US US12/753,560 patent/US8583284B2/en not_active Expired - Fee Related
- 2010-04-05 JP JP2010087108A patent/JP5183665B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP2249292A1 (en) | 2010-11-10 |
US8583284B2 (en) | 2013-11-12 |
US20100262286A1 (en) | 2010-10-14 |
JP2010244549A (ja) | 2010-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5183665B2 (ja) | ロボットの少なくとも1つの将来的活動を決定する決定メカニズム、方法、モジュールおよび決定するように構成されたロボット | |
Eidenberger et al. | Active perception and scene modeling by planning with probabilistic 6d object poses | |
Zhang et al. | Hierarchical reinforcement learning by discovering intrinsic options | |
EP3370206B1 (en) | Spatially consistent multi-scale anatomical landmark detection in incomplete 3d-ct data | |
Martinez-Cantin et al. | A Bayesian exploration-exploitation approach for optimal online sensing and planning with a visually guided mobile robot | |
Brooks et al. | Parametric POMDPs for planning in continuous state spaces | |
Sukkar et al. | Multi-robot region-of-interest reconstruction with Dec-MCTS | |
JP2010244549A5 (ja) | ||
US9361590B2 (en) | Information processing apparatus, information processing method, and program | |
Boots et al. | Learning predictive models of a depth camera & manipulator from raw execution traces | |
US9111172B2 (en) | Information processing device, information processing method, and program | |
Shi et al. | Social interpretable tree for pedestrian trajectory prediction | |
Kim et al. | Planning for grasp selection of partially occluded objects | |
Wen et al. | End-to-end semi-supervised learning for differentiable particle filters | |
Menon et al. | NBV-SC: Next best view planning based on shape completion for fruit mapping and reconstruction | |
Wang et al. | Virtual maps for autonomous exploration with pose SLAM | |
Eidenberger et al. | Probabilistic action planning for active scene modeling in continuous high-dimensional domains | |
EP2275993A2 (en) | Method for estimating the visibility of features on surfaces of object instances in multi-object scenes and method for perception planning in multi-object scenes | |
Liu et al. | A cardinality modified product multi-sensor PHD | |
Leung et al. | Evaluating set measurement likelihoods in random-finite-set slam | |
Greigarn et al. | Task-oriented active sensing via action entropy minimization | |
Pantrigo et al. | Multi-dimensional visual tracking using scatter search particle filter | |
Rauch et al. | Learning-driven coarse-to-fine articulated robot tracking | |
Laporte et al. | A fast discriminant approach to active object recognition and pose estimation | |
Pantrigo et al. | Heuristic particle filter: applying abstraction techniques to the design of visual tracking algorithms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101026 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20101227 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20101228 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120210 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120508 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120511 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20120608 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121214 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130115 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160125 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |