JP2018151876A - 機械学習に使用される経験を格納する経験データベースを更新する方法 - Google Patents
機械学習に使用される経験を格納する経験データベースを更新する方法 Download PDFInfo
- Publication number
- JP2018151876A JP2018151876A JP2017047791A JP2017047791A JP2018151876A JP 2018151876 A JP2018151876 A JP 2018151876A JP 2017047791 A JP2017047791 A JP 2017047791A JP 2017047791 A JP2017047791 A JP 2017047791A JP 2018151876 A JP2018151876 A JP 2018151876A
- Authority
- JP
- Japan
- Prior art keywords
- experience
- robot
- experiences
- similarity
- new
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Manipulator (AREA)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017047791A JP2018151876A (ja) | 2017-03-13 | 2017-03-13 | 機械学習に使用される経験を格納する経験データベースを更新する方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017047791A JP2018151876A (ja) | 2017-03-13 | 2017-03-13 | 機械学習に使用される経験を格納する経験データベースを更新する方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2018151876A true JP2018151876A (ja) | 2018-09-27 |
| JP2018151876A5 JP2018151876A5 (enExample) | 2020-03-05 |
Family
ID=63681775
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017047791A Pending JP2018151876A (ja) | 2017-03-13 | 2017-03-13 | 機械学習に使用される経験を格納する経験データベースを更新する方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2018151876A (enExample) |
Cited By (15)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109760046A (zh) * | 2018-12-27 | 2019-05-17 | 西北工业大学 | 基于强化学习的空间机器人捕获翻滚目标运动规划方法 |
| WO2020111647A1 (en) * | 2018-11-30 | 2020-06-04 | Samsung Electronics Co., Ltd. | Multi-task based lifelong learning |
| CN111300390A (zh) * | 2020-03-20 | 2020-06-19 | 苏州大学 | 基于蓄水池采样和双经验池的机械臂智能控制系统 |
| WO2020179299A1 (ja) * | 2019-03-01 | 2020-09-10 | 株式会社Preferred Networks | 情報処理装置及び情報処理方法 |
| KR20200123574A (ko) * | 2019-04-22 | 2020-10-30 | 서울대학교병원 | 학습 기반의 증상 및 질환 관리 장치 및 방법 |
| KR20200126822A (ko) * | 2019-04-30 | 2020-11-09 | 중앙대학교 산학협력단 | 심층 강화학습 기반 mmWave 차량 네트워크의 비디오 품질을 고려한 선제적 캐싱정책 학습 기법 및 그의 시스템 |
| JP2021057024A (ja) * | 2019-08-29 | 2021-04-08 | ザ・ボーイング・カンパニーThe Boeing Company | 航空機を制御するためのニューラルネットワークを訓練するためのシステム及び方法 |
| CN113022582A (zh) * | 2019-12-24 | 2021-06-25 | 本田技研工业株式会社 | 控制装置、控制装置的控制方法、记录介质、信息处理服务器、信息处理方法以及控制系统 |
| US20210286786A1 (en) * | 2019-04-11 | 2021-09-16 | Tencent Technology (Shenzhen) Company Limited | Database performance tuning method, apparatus, and system, device, and storage medium |
| JP2021189621A (ja) * | 2020-05-27 | 2021-12-13 | 株式会社 日立産業制御ソリューションズ | 行動選択システム及び行動選択方法 |
| CN114298302A (zh) * | 2021-12-15 | 2022-04-08 | 中国科学院自动化研究所 | 智能体任务学习方法及装置 |
| KR20220093845A (ko) * | 2020-12-28 | 2022-07-05 | 한국전자통신연구원 | 행동의 시계열적 특성을 반영한 데이터 정제 및 행동인식 모델의 성능 향상 장치 및 방법 |
| WO2023164223A1 (en) * | 2022-02-28 | 2023-08-31 | Advanced Micro Devices, Inc. | Quantifying the human-likeness of artificially intelligent agents using statistical methods and techniques |
| JP2023181699A (ja) * | 2022-06-13 | 2023-12-25 | 株式会社Kddi総合研究所 | 最適化装置、最適化方法及びコンピュータプログラム |
| CN118334383A (zh) * | 2024-06-13 | 2024-07-12 | 山东智航智能装备有限公司 | 一种变化检测样本更新方法及装置 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0535711A (ja) * | 1991-07-31 | 1993-02-12 | Toyoda Mach Works Ltd | ニユーラルネツトワークの学習データ記憶装置 |
| WO2008047835A1 (fr) * | 2006-10-19 | 2008-04-24 | Nec Corporation | Système, procédé et programme d'étude active |
| JP2013084175A (ja) * | 2011-10-12 | 2013-05-09 | Sony Corp | 情報処理装置、情報処理方法、及びプログラム |
| JP2014505934A (ja) * | 2010-12-30 | 2014-03-06 | アイロボット コーポレイション | 可動式ロボットシステム |
-
2017
- 2017-03-13 JP JP2017047791A patent/JP2018151876A/ja active Pending
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0535711A (ja) * | 1991-07-31 | 1993-02-12 | Toyoda Mach Works Ltd | ニユーラルネツトワークの学習データ記憶装置 |
| WO2008047835A1 (fr) * | 2006-10-19 | 2008-04-24 | Nec Corporation | Système, procédé et programme d'étude active |
| JP2014505934A (ja) * | 2010-12-30 | 2014-03-06 | アイロボット コーポレイション | 可動式ロボットシステム |
| JP2013084175A (ja) * | 2011-10-12 | 2013-05-09 | Sony Corp | 情報処理装置、情報処理方法、及びプログラム |
Non-Patent Citations (1)
| Title |
|---|
| TEERAPAT ROJANAARPA ET AL.: "Density-based Data Pruning Method for Deep Reinforcement Learning", PROCEEDINGS OF THE 2016 15TH IEEE INTERNATIONAL CONFERENCE ON MACHINE LEARNING AND APPLICATIONS, JPN6021003933, 18 December 2016 (2016-12-18), pages 266 - 271, ISSN: 0004490000 * |
Cited By (27)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11775812B2 (en) | 2018-11-30 | 2023-10-03 | Samsung Electronics Co., Ltd. | Multi-task based lifelong learning |
| WO2020111647A1 (en) * | 2018-11-30 | 2020-06-04 | Samsung Electronics Co., Ltd. | Multi-task based lifelong learning |
| CN109760046A (zh) * | 2018-12-27 | 2019-05-17 | 西北工业大学 | 基于强化学习的空间机器人捕获翻滚目标运动规划方法 |
| WO2020179299A1 (ja) * | 2019-03-01 | 2020-09-10 | 株式会社Preferred Networks | 情報処理装置及び情報処理方法 |
| US12287768B2 (en) * | 2019-04-11 | 2025-04-29 | Tencent Technology (Shenzhen) Company Limited | Database performance tuning method, apparatus, and system, device, and storage medium |
| US20210286786A1 (en) * | 2019-04-11 | 2021-09-16 | Tencent Technology (Shenzhen) Company Limited | Database performance tuning method, apparatus, and system, device, and storage medium |
| KR20200123574A (ko) * | 2019-04-22 | 2020-10-30 | 서울대학교병원 | 학습 기반의 증상 및 질환 관리 장치 및 방법 |
| KR102338964B1 (ko) * | 2019-04-22 | 2021-12-14 | 서울대학교병원 | 학습 기반의 증상 및 질환 관리 장치 및 방법 |
| KR102240442B1 (ko) * | 2019-04-30 | 2021-04-15 | 중앙대학교 산학협력단 | 심층 강화학습 기반 mmWave 차량 네트워크의 비디오 품질을 고려한 선제적 캐싱정책 학습 기법 및 그의 시스템 |
| KR20200126822A (ko) * | 2019-04-30 | 2020-11-09 | 중앙대학교 산학협력단 | 심층 강화학습 기반 mmWave 차량 네트워크의 비디오 품질을 고려한 선제적 캐싱정책 학습 기법 및 그의 시스템 |
| JP2021057024A (ja) * | 2019-08-29 | 2021-04-08 | ザ・ボーイング・カンパニーThe Boeing Company | 航空機を制御するためのニューラルネットワークを訓練するためのシステム及び方法 |
| JP7541876B2 (ja) | 2019-08-29 | 2024-08-29 | ザ・ボーイング・カンパニー | 航空機を制御するためのニューラルネットワークを訓練するためのシステム及び方法 |
| CN113022582A (zh) * | 2019-12-24 | 2021-06-25 | 本田技研工业株式会社 | 控制装置、控制装置的控制方法、记录介质、信息处理服务器、信息处理方法以及控制系统 |
| JP2021103356A (ja) * | 2019-12-24 | 2021-07-15 | 本田技研工業株式会社 | 制御装置、制御装置の制御方法、プログラム、情報処理サーバ、情報処理方法、並びに制御システム |
| US11934951B2 (en) | 2019-12-24 | 2024-03-19 | Honda Motor Co., Ltd. | Control apparatus, control method for control apparatus, non-transitory computer readable storage medium, information processing server, information processing method, and control system for controlling system using reinforcement learning |
| CN113022582B (zh) * | 2019-12-24 | 2024-02-13 | 本田技研工业株式会社 | 控制装置、控制装置的控制方法、记录介质、信息处理服务器、信息处理方法以及控制系统 |
| JP7357537B2 (ja) | 2019-12-24 | 2023-10-06 | 本田技研工業株式会社 | 制御装置、制御装置の制御方法、プログラム、情報処理サーバ、情報処理方法、並びに制御システム |
| CN111300390B (zh) * | 2020-03-20 | 2021-03-23 | 南栖仙策(南京)科技有限公司 | 基于蓄水池采样和双经验池的机械臂智能控制系统 |
| CN111300390A (zh) * | 2020-03-20 | 2020-06-19 | 苏州大学 | 基于蓄水池采样和双经验池的机械臂智能控制系统 |
| JP7365967B2 (ja) | 2020-05-27 | 2023-10-20 | 株式会社 日立産業制御ソリューションズ | 行動選択システム及び行動選択方法 |
| JP2021189621A (ja) * | 2020-05-27 | 2021-12-13 | 株式会社 日立産業制御ソリューションズ | 行動選択システム及び行動選択方法 |
| KR20220093845A (ko) * | 2020-12-28 | 2022-07-05 | 한국전자통신연구원 | 행동의 시계열적 특성을 반영한 데이터 정제 및 행동인식 모델의 성능 향상 장치 및 방법 |
| KR102833718B1 (ko) * | 2020-12-28 | 2025-07-14 | 한국전자통신연구원 | 행동의 시계열적 특성을 반영한 데이터 정제 및 행동인식 모델의 성능 향상 장치 및 방법 |
| CN114298302A (zh) * | 2021-12-15 | 2022-04-08 | 中国科学院自动化研究所 | 智能体任务学习方法及装置 |
| WO2023164223A1 (en) * | 2022-02-28 | 2023-08-31 | Advanced Micro Devices, Inc. | Quantifying the human-likeness of artificially intelligent agents using statistical methods and techniques |
| JP2023181699A (ja) * | 2022-06-13 | 2023-12-25 | 株式会社Kddi総合研究所 | 最適化装置、最適化方法及びコンピュータプログラム |
| CN118334383A (zh) * | 2024-06-13 | 2024-07-12 | 山东智航智能装备有限公司 | 一种变化检测样本更新方法及装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2018151876A (ja) | 機械学習に使用される経験を格納する経験データベースを更新する方法 | |
| US12147899B2 (en) | Training action selection neural networks using look-ahead search | |
| Huang et al. | Continual model-based reinforcement learning with hypernetworks | |
| CN110490717B (zh) | 基于用户会话及图卷积神经网络的商品推荐方法及系统 | |
| KR102492205B1 (ko) | 역강화학습 기반 배달 수단 탐지 장치 및 방법 | |
| US11080586B2 (en) | Neural network reinforcement learning | |
| JP2022525423A (ja) | ダブルアクタークリティックアルゴリズムを通じた強化学習 | |
| JP7707846B2 (ja) | 経路計画システム、経路計画方法、ロードマップ構築装置、モデル生成装置、及びモデル生成方法 | |
| CN113614743B (zh) | 用于操控机器人的方法和设备 | |
| WO2013086186A2 (en) | Particle methods for nonlinear control | |
| JP7529145B2 (ja) | 学習装置、学習方法および学習プログラム | |
| CN118081773A (zh) | 一种基于综合损失的演员评论家算法的机器人控制方法 | |
| CN118378094B (zh) | 芯片布局模型训练及运用方法、装置、电子设备及存储介质 | |
| Zeng et al. | Visual navigation with asynchronous proximal policy optimization in artificial agents | |
| JP2020181486A (ja) | 特徴ベクトルを生成するシステム | |
| CN113449176A (zh) | 基于知识图谱的推荐方法及装置 | |
| CN119623309A (zh) | 一种边坡稳定性预测方法及装置 | |
| Li et al. | An extended probabilistic model building genetic network programming using both of good and bad individuals | |
| García et al. | Incremental reinforcement learning for multi-objective robotic tasks | |
| CN111240318A (zh) | 一种机器人的人员发现算法 | |
| Terence et al. | Dual Action Policy for Robust Sim-to-Real Reinforcement Learning | |
| JP4267726B2 (ja) | 制御装置における動作信号と操作量との関係を決定する装置、制御装置、データ生成装置、入出力特性決定装置及び相関関係評価装置 | |
| JP7092228B1 (ja) | 学習装置、学習方法およびプログラム | |
| JP7766632B2 (ja) | 学習装置、推論装置、学習方法、推論方法、学習プログラム及び推論プログラム | |
| Shyr | Introduction and comparison of three evolutionary-based Intelligent algorithms for optimal design |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200124 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200124 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210129 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210209 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210319 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20210420 |