JP2018151876A - 機械学習に使用される経験を格納する経験データベースを更新する方法 - Google Patents

機械学習に使用される経験を格納する経験データベースを更新する方法 Download PDF

Info

Publication number
JP2018151876A
JP2018151876A JP2017047791A JP2017047791A JP2018151876A JP 2018151876 A JP2018151876 A JP 2018151876A JP 2017047791 A JP2017047791 A JP 2017047791A JP 2017047791 A JP2017047791 A JP 2017047791A JP 2018151876 A JP2018151876 A JP 2018151876A
Authority
JP
Japan
Prior art keywords
experience
robot
experiences
similarity
new
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017047791A
Other languages
English (en)
Japanese (ja)
Other versions
JP2018151876A5 (enExample
Inventor
フォン グエン
Huong Nguyen
フォン グエン
高行 秋山
Takayuki Akiyama
高行 秋山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2017047791A priority Critical patent/JP2018151876A/ja
Publication of JP2018151876A publication Critical patent/JP2018151876A/ja
Publication of JP2018151876A5 publication Critical patent/JP2018151876A5/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Manipulator (AREA)
JP2017047791A 2017-03-13 2017-03-13 機械学習に使用される経験を格納する経験データベースを更新する方法 Pending JP2018151876A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017047791A JP2018151876A (ja) 2017-03-13 2017-03-13 機械学習に使用される経験を格納する経験データベースを更新する方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017047791A JP2018151876A (ja) 2017-03-13 2017-03-13 機械学習に使用される経験を格納する経験データベースを更新する方法

Publications (2)

Publication Number Publication Date
JP2018151876A true JP2018151876A (ja) 2018-09-27
JP2018151876A5 JP2018151876A5 (enExample) 2020-03-05

Family

ID=63681775

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017047791A Pending JP2018151876A (ja) 2017-03-13 2017-03-13 機械学習に使用される経験を格納する経験データベースを更新する方法

Country Status (1)

Country Link
JP (1) JP2018151876A (enExample)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109760046A (zh) * 2018-12-27 2019-05-17 西北工业大学 基于强化学习的空间机器人捕获翻滚目标运动规划方法
WO2020111647A1 (en) * 2018-11-30 2020-06-04 Samsung Electronics Co., Ltd. Multi-task based lifelong learning
CN111300390A (zh) * 2020-03-20 2020-06-19 苏州大学 基于蓄水池采样和双经验池的机械臂智能控制系统
WO2020179299A1 (ja) * 2019-03-01 2020-09-10 株式会社Preferred Networks 情報処理装置及び情報処理方法
KR20200123574A (ko) * 2019-04-22 2020-10-30 서울대학교병원 학습 기반의 증상 및 질환 관리 장치 및 방법
KR20200126822A (ko) * 2019-04-30 2020-11-09 중앙대학교 산학협력단 심층 강화학습 기반 mmWave 차량 네트워크의 비디오 품질을 고려한 선제적 캐싱정책 학습 기법 및 그의 시스템
JP2021057024A (ja) * 2019-08-29 2021-04-08 ザ・ボーイング・カンパニーThe Boeing Company 航空機を制御するためのニューラルネットワークを訓練するためのシステム及び方法
CN113022582A (zh) * 2019-12-24 2021-06-25 本田技研工业株式会社 控制装置、控制装置的控制方法、记录介质、信息处理服务器、信息处理方法以及控制系统
US20210286786A1 (en) * 2019-04-11 2021-09-16 Tencent Technology (Shenzhen) Company Limited Database performance tuning method, apparatus, and system, device, and storage medium
JP2021189621A (ja) * 2020-05-27 2021-12-13 株式会社 日立産業制御ソリューションズ 行動選択システム及び行動選択方法
CN114298302A (zh) * 2021-12-15 2022-04-08 中国科学院自动化研究所 智能体任务学习方法及装置
KR20220093845A (ko) * 2020-12-28 2022-07-05 한국전자통신연구원 행동의 시계열적 특성을 반영한 데이터 정제 및 행동인식 모델의 성능 향상 장치 및 방법
WO2023164223A1 (en) * 2022-02-28 2023-08-31 Advanced Micro Devices, Inc. Quantifying the human-likeness of artificially intelligent agents using statistical methods and techniques
JP2023181699A (ja) * 2022-06-13 2023-12-25 株式会社Kddi総合研究所 最適化装置、最適化方法及びコンピュータプログラム
CN118334383A (zh) * 2024-06-13 2024-07-12 山东智航智能装备有限公司 一种变化检测样本更新方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0535711A (ja) * 1991-07-31 1993-02-12 Toyoda Mach Works Ltd ニユーラルネツトワークの学習データ記憶装置
WO2008047835A1 (fr) * 2006-10-19 2008-04-24 Nec Corporation Système, procédé et programme d'étude active
JP2013084175A (ja) * 2011-10-12 2013-05-09 Sony Corp 情報処理装置、情報処理方法、及びプログラム
JP2014505934A (ja) * 2010-12-30 2014-03-06 アイロボット コーポレイション 可動式ロボットシステム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0535711A (ja) * 1991-07-31 1993-02-12 Toyoda Mach Works Ltd ニユーラルネツトワークの学習データ記憶装置
WO2008047835A1 (fr) * 2006-10-19 2008-04-24 Nec Corporation Système, procédé et programme d'étude active
JP2014505934A (ja) * 2010-12-30 2014-03-06 アイロボット コーポレイション 可動式ロボットシステム
JP2013084175A (ja) * 2011-10-12 2013-05-09 Sony Corp 情報処理装置、情報処理方法、及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TEERAPAT ROJANAARPA ET AL.: "Density-based Data Pruning Method for Deep Reinforcement Learning", PROCEEDINGS OF THE 2016 15TH IEEE INTERNATIONAL CONFERENCE ON MACHINE LEARNING AND APPLICATIONS, JPN6021003933, 18 December 2016 (2016-12-18), pages 266 - 271, ISSN: 0004490000 *

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11775812B2 (en) 2018-11-30 2023-10-03 Samsung Electronics Co., Ltd. Multi-task based lifelong learning
WO2020111647A1 (en) * 2018-11-30 2020-06-04 Samsung Electronics Co., Ltd. Multi-task based lifelong learning
CN109760046A (zh) * 2018-12-27 2019-05-17 西北工业大学 基于强化学习的空间机器人捕获翻滚目标运动规划方法
WO2020179299A1 (ja) * 2019-03-01 2020-09-10 株式会社Preferred Networks 情報処理装置及び情報処理方法
US12287768B2 (en) * 2019-04-11 2025-04-29 Tencent Technology (Shenzhen) Company Limited Database performance tuning method, apparatus, and system, device, and storage medium
US20210286786A1 (en) * 2019-04-11 2021-09-16 Tencent Technology (Shenzhen) Company Limited Database performance tuning method, apparatus, and system, device, and storage medium
KR20200123574A (ko) * 2019-04-22 2020-10-30 서울대학교병원 학습 기반의 증상 및 질환 관리 장치 및 방법
KR102338964B1 (ko) * 2019-04-22 2021-12-14 서울대학교병원 학습 기반의 증상 및 질환 관리 장치 및 방법
KR102240442B1 (ko) * 2019-04-30 2021-04-15 중앙대학교 산학협력단 심층 강화학습 기반 mmWave 차량 네트워크의 비디오 품질을 고려한 선제적 캐싱정책 학습 기법 및 그의 시스템
KR20200126822A (ko) * 2019-04-30 2020-11-09 중앙대학교 산학협력단 심층 강화학습 기반 mmWave 차량 네트워크의 비디오 품질을 고려한 선제적 캐싱정책 학습 기법 및 그의 시스템
JP2021057024A (ja) * 2019-08-29 2021-04-08 ザ・ボーイング・カンパニーThe Boeing Company 航空機を制御するためのニューラルネットワークを訓練するためのシステム及び方法
JP7541876B2 (ja) 2019-08-29 2024-08-29 ザ・ボーイング・カンパニー 航空機を制御するためのニューラルネットワークを訓練するためのシステム及び方法
CN113022582A (zh) * 2019-12-24 2021-06-25 本田技研工业株式会社 控制装置、控制装置的控制方法、记录介质、信息处理服务器、信息处理方法以及控制系统
JP2021103356A (ja) * 2019-12-24 2021-07-15 本田技研工業株式会社 制御装置、制御装置の制御方法、プログラム、情報処理サーバ、情報処理方法、並びに制御システム
US11934951B2 (en) 2019-12-24 2024-03-19 Honda Motor Co., Ltd. Control apparatus, control method for control apparatus, non-transitory computer readable storage medium, information processing server, information processing method, and control system for controlling system using reinforcement learning
CN113022582B (zh) * 2019-12-24 2024-02-13 本田技研工业株式会社 控制装置、控制装置的控制方法、记录介质、信息处理服务器、信息处理方法以及控制系统
JP7357537B2 (ja) 2019-12-24 2023-10-06 本田技研工業株式会社 制御装置、制御装置の制御方法、プログラム、情報処理サーバ、情報処理方法、並びに制御システム
CN111300390B (zh) * 2020-03-20 2021-03-23 南栖仙策(南京)科技有限公司 基于蓄水池采样和双经验池的机械臂智能控制系统
CN111300390A (zh) * 2020-03-20 2020-06-19 苏州大学 基于蓄水池采样和双经验池的机械臂智能控制系统
JP7365967B2 (ja) 2020-05-27 2023-10-20 株式会社 日立産業制御ソリューションズ 行動選択システム及び行動選択方法
JP2021189621A (ja) * 2020-05-27 2021-12-13 株式会社 日立産業制御ソリューションズ 行動選択システム及び行動選択方法
KR20220093845A (ko) * 2020-12-28 2022-07-05 한국전자통신연구원 행동의 시계열적 특성을 반영한 데이터 정제 및 행동인식 모델의 성능 향상 장치 및 방법
KR102833718B1 (ko) * 2020-12-28 2025-07-14 한국전자통신연구원 행동의 시계열적 특성을 반영한 데이터 정제 및 행동인식 모델의 성능 향상 장치 및 방법
CN114298302A (zh) * 2021-12-15 2022-04-08 中国科学院自动化研究所 智能体任务学习方法及装置
WO2023164223A1 (en) * 2022-02-28 2023-08-31 Advanced Micro Devices, Inc. Quantifying the human-likeness of artificially intelligent agents using statistical methods and techniques
JP2023181699A (ja) * 2022-06-13 2023-12-25 株式会社Kddi総合研究所 最適化装置、最適化方法及びコンピュータプログラム
CN118334383A (zh) * 2024-06-13 2024-07-12 山东智航智能装备有限公司 一种变化检测样本更新方法及装置

Similar Documents

Publication Publication Date Title
JP2018151876A (ja) 機械学習に使用される経験を格納する経験データベースを更新する方法
US12147899B2 (en) Training action selection neural networks using look-ahead search
Huang et al. Continual model-based reinforcement learning with hypernetworks
CN110490717B (zh) 基于用户会话及图卷积神经网络的商品推荐方法及系统
KR102492205B1 (ko) 역강화학습 기반 배달 수단 탐지 장치 및 방법
US11080586B2 (en) Neural network reinforcement learning
JP2022525423A (ja) ダブルアクタークリティックアルゴリズムを通じた強化学習
JP7707846B2 (ja) 経路計画システム、経路計画方法、ロードマップ構築装置、モデル生成装置、及びモデル生成方法
CN113614743B (zh) 用于操控机器人的方法和设备
WO2013086186A2 (en) Particle methods for nonlinear control
JP7529145B2 (ja) 学習装置、学習方法および学習プログラム
CN118081773A (zh) 一种基于综合损失的演员评论家算法的机器人控制方法
CN118378094B (zh) 芯片布局模型训练及运用方法、装置、电子设备及存储介质
Zeng et al. Visual navigation with asynchronous proximal policy optimization in artificial agents
JP2020181486A (ja) 特徴ベクトルを生成するシステム
CN113449176A (zh) 基于知识图谱的推荐方法及装置
CN119623309A (zh) 一种边坡稳定性预测方法及装置
Li et al. An extended probabilistic model building genetic network programming using both of good and bad individuals
García et al. Incremental reinforcement learning for multi-objective robotic tasks
CN111240318A (zh) 一种机器人的人员发现算法
Terence et al. Dual Action Policy for Robust Sim-to-Real Reinforcement Learning
JP4267726B2 (ja) 制御装置における動作信号と操作量との関係を決定する装置、制御装置、データ生成装置、入出力特性決定装置及び相関関係評価装置
JP7092228B1 (ja) 学習装置、学習方法およびプログラム
JP7766632B2 (ja) 学習装置、推論装置、学習方法、推論方法、学習プログラム及び推論プログラム
Shyr Introduction and comparison of three evolutionary-based Intelligent algorithms for optimal design

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200124

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210319

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210420