JP2012208789A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2012208789A5 JP2012208789A5 JP2011074694A JP2011074694A JP2012208789A5 JP 2012208789 A5 JP2012208789 A5 JP 2012208789A5 JP 2011074694 A JP2011074694 A JP 2011074694A JP 2011074694 A JP2011074694 A JP 2011074694A JP 2012208789 A5 JP2012208789 A5 JP 2012208789A5
- Authority
- JP
- Japan
- Prior art keywords
- external force
- virtual external
- output
- control
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2011074694A JP5750657B2 (ja) | 2011-03-30 | 2011-03-30 | 強化学習装置、制御装置、および強化学習方法 |
| US13/432,094 US8886357B2 (en) | 2011-03-30 | 2012-03-28 | Reinforcement learning apparatus, control apparatus, and reinforcement learning method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2011074694A JP5750657B2 (ja) | 2011-03-30 | 2011-03-30 | 強化学習装置、制御装置、および強化学習方法 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2012208789A JP2012208789A (ja) | 2012-10-25 |
| JP2012208789A5 true JP2012208789A5 (enExample) | 2014-05-22 |
| JP5750657B2 JP5750657B2 (ja) | 2015-07-22 |
Family
ID=46928279
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2011074694A Active JP5750657B2 (ja) | 2011-03-30 | 2011-03-30 | 強化学習装置、制御装置、および強化学習方法 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US8886357B2 (enExample) |
| JP (1) | JP5750657B2 (enExample) |
Families Citing this family (21)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6522488B2 (ja) * | 2015-07-31 | 2019-05-29 | ファナック株式会社 | ワークの取り出し動作を学習する機械学習装置、ロボットシステムおよび機械学習方法 |
| DE102016015936B8 (de) | 2015-07-31 | 2024-10-24 | Fanuc Corporation | Vorrichtung für maschinelles Lernen, Robotersystem und maschinelles Lernsystem zum Lernen eines Werkstückaufnahmevorgangs |
| JP6240689B2 (ja) | 2015-07-31 | 2017-11-29 | ファナック株式会社 | 人の行動パターンを学習する機械学習装置、ロボット制御装置、ロボットシステム、および機械学習方法 |
| JP6106226B2 (ja) * | 2015-07-31 | 2017-03-29 | ファナック株式会社 | ゲインの最適化を学習する機械学習装置及び機械学習装置を備えた電動機制御装置並びに機械学習方法 |
| US10839302B2 (en) | 2015-11-24 | 2020-11-17 | The Research Foundation For The State University Of New York | Approximate value iteration with complex returns by bounding |
| JP6733239B2 (ja) | 2016-03-18 | 2020-07-29 | セイコーエプソン株式会社 | 制御装置及びロボットシステム |
| JP2017199077A (ja) * | 2016-04-25 | 2017-11-02 | ファナック株式会社 | 複数台の産業機械を有する生産システムの動作を最適化するセルコントローラ |
| CN106886451B (zh) * | 2017-01-10 | 2020-10-27 | 广东石油化工学院 | 一种基于虚拟化容器技术的多工作流任务分配方法 |
| JP6453919B2 (ja) * | 2017-01-26 | 2019-01-16 | ファナック株式会社 | 行動情報学習装置、行動情報最適化システム及び行動情報学習プログラム |
| JP6706223B2 (ja) * | 2017-05-25 | 2020-06-03 | 日本電信電話株式会社 | 移動体制御方法、移動体制御装置、及びプログラム |
| JP6748135B2 (ja) * | 2018-03-19 | 2020-08-26 | ファナック株式会社 | 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法 |
| JP7131087B2 (ja) * | 2018-05-31 | 2022-09-06 | セイコーエプソン株式会社 | ロボットシステムの制御方法およびロボットシステム |
| US11403513B2 (en) * | 2018-09-27 | 2022-08-02 | Deepmind Technologies Limited | Learning motor primitives and training a machine learning system using a linear-feedback-stabilized policy |
| CN109711040B (zh) * | 2018-12-25 | 2023-06-02 | 南京天洑软件有限公司 | 一种基于搜索方向学习的智能工业设计强化学习算法 |
| EP3920000A4 (en) * | 2019-01-30 | 2022-01-26 | NEC Corporation | CONTROL DEVICE, ORDER METHOD AND RECORDING MEDIA |
| JP7225923B2 (ja) | 2019-03-04 | 2023-02-21 | 富士通株式会社 | 強化学習方法、強化学習プログラム、および強化学習システム |
| JP7379833B2 (ja) * | 2019-03-04 | 2023-11-15 | 富士通株式会社 | 強化学習方法、強化学習プログラム、および強化学習システム |
| US12093001B2 (en) * | 2019-05-22 | 2024-09-17 | Nec Corporation | Operation rule determination device, method, and recording medium using frequency of a cumulative reward calculated for series of operations |
| US11676064B2 (en) * | 2019-08-16 | 2023-06-13 | Mitsubishi Electric Research Laboratories, Inc. | Constraint adaptor for reinforcement learning control |
| CN110496377B (zh) * | 2019-08-19 | 2020-07-28 | 华南理工大学 | 一种基于强化学习的虚拟乒乓球手击球训练方法 |
| DE102019130040A1 (de) * | 2019-11-07 | 2021-05-12 | Bayerische Motoren Werke Aktiengesellschaft | Verfahren und System zum Prüfen einer automatisierten Fahrfunktion durch Reinforcement-Learning |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4587738B2 (ja) * | 2003-08-25 | 2010-11-24 | ソニー株式会社 | ロボット装置及びロボットの姿勢制御方法 |
| JP4929449B2 (ja) * | 2005-09-02 | 2012-05-09 | 国立大学法人横浜国立大学 | 強化学習装置および強化学習方法 |
| US8458715B1 (en) * | 2007-02-23 | 2013-06-04 | Hrl Laboratories, Llc | System for allocating resources to optimize transition from a current state to a desired state |
-
2011
- 2011-03-30 JP JP2011074694A patent/JP5750657B2/ja active Active
-
2012
- 2012-03-28 US US13/432,094 patent/US8886357B2/en active Active
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2012208789A5 (enExample) | ||
| JP5750657B2 (ja) | 強化学習装置、制御装置、および強化学習方法 | |
| EP3621773B1 (en) | Viewpoint invariant visual servoing of robot end effector using recurrent neural network | |
| US11554485B2 (en) | Generating a robot control policy from demonstrations collected via kinesthetic teaching of a robot | |
| US11429854B2 (en) | Method and device for a computerized mechanical device | |
| KR101048098B1 (ko) | 로봇의 경로계획 장치 및 방법 | |
| EP3899797A1 (en) | Multi-agent reinforcement learning with matchmaking policies | |
| US11305428B2 (en) | Robot motion planning device, robotic system, and method | |
| WO2020065001A1 (en) | Learning motor primitives and training a machine learning system using a linear-feedback-stabilized policy | |
| US8217932B2 (en) | Systems and methods for implementing haptic systems and stimulated environments | |
| KR20190040506A (ko) | 로봇 조작을 위한 심층 강화 학습 | |
| US11461589B1 (en) | Mitigating reality gap through modification of simulated state data of robotic simulator | |
| CN105056528A (zh) | 一种虚拟角色的移动方法及装置 | |
| CN113165178B (zh) | 使用高级策略模型和经训练的低级策略模型进行机器人导航 | |
| CN112512755A (zh) | 使用从2.5d视觉数据预测的域不变3d表示的机器人操纵 | |
| WO2009067458A1 (en) | Learning capture points for humanoid push recovery | |
| US10556336B1 (en) | Determining robot inertial properties | |
| US11213946B1 (en) | Mitigating reality gap through optimization of simulated hardware parameter(s) of simulated robot | |
| JP2019087096A (ja) | 行動決定システム及び自動運転制御装置 | |
| CN115047769B (zh) | 一种基于约束跟随的无人作战平台避障-到达控制方法 | |
| JP2010287131A (ja) | 学習制御ステム及び学習制御方法 | |
| WO2019222597A1 (en) | System and methods for pixel based model predictive control | |
| CN108121347B (zh) | 用于控制设备运动的方法、装置及电子设备 | |
| EP3900887A1 (en) | Robot collision detection using cascading variational autoencoder | |
| CN113459841B (zh) | 基于无标定双目视觉的自动充电控制方法和装置 |