JP2018151876A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2018151876A5 JP2018151876A5 JP2017047791A JP2017047791A JP2018151876A5 JP 2018151876 A5 JP2018151876 A5 JP 2018151876A5 JP 2017047791 A JP2017047791 A JP 2017047791A JP 2017047791 A JP2017047791 A JP 2017047791A JP 2018151876 A5 JP2018151876 A5 JP 2018151876A5
- Authority
- JP
- Japan
- Prior art keywords
- experience
- learning system
- experiences
- similarity
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 claims 4
- 238000010801 machine learning Methods 0.000 claims 3
- 230000001537 neural Effects 0.000 claims 3
- 230000006399 behavior Effects 0.000 claims 2
- 230000004044 response Effects 0.000 claims 1
- 238000005070 sampling Methods 0.000 claims 1
Claims (10)
- 機械学習に使用される経験を格納する経験データベース、を更新する方法であって、
学習システムが、エージェントの新しい経験を取得し、
前記学習システムが、前記新しい経験と前記経験データベースから取得された1以上の過去の経験との間の、類似度を決定し、
前記経験データベースは、機械学習において、前記エージェントの行動の評価値を決定する評価モデルを学習するために使用され、
前記学習システムが、前記類似度に基づいて、前記新しい経験を前記経験データベースに格納するか決定する、方法。 - 請求項1に記載の方法であって、
前記学習システムが、前記新しい経験と前記経験データベースに格納されている全経験それぞれとの間の類似度の総計に基づいて、前記新しい経験を前記経験データベースに格納するか決定する、方法。 - 請求項1に記載の方法であって、
前記学習システムが、前記経験データベースに格納されている既存経験の数が規定数に達している場合に、前記類似度に基づいて、前記新しい経験を前記経験データベースに格納するか決定する、方法。 - 請求項1に記載の方法であって、
前記学習システムが、前記類似度と乱数とに基づいて、前記新しい経験を前記経験データベースに格納するか決定する、方法。 - 請求項1に記載の方法であって、
前記学習システムが、前記経験データベースに格納されている既存経験の数が規定数に達している場合に、前記既存経験の格納順に基づいて、前記既存経験から削除する経験を選択する、方法。 - 請求項1に記載の方法であって、
前記学習システムが、前記経験データベースに格納されている既存経験の数が規定数に達している場合に、前記既存経験間の類似度に基づいて、前記既存経験から削除する経験を選択する、方法。 - 請求項6に記載の方法であって、
前記学習システムが、前記既存経験間の類似度を示すテーブルを参照して、前記既存経験間の類似度を決定し、
前記経験データベースの更新に応じて、前記テーブルを更新する、方法。 - 請求項1に記載の方法であって、
前記エージェントは仮想環境におけるロボットであり、
前記学習システムが、ニューラルネットワークに基づいて、前記仮想環境において前記ロボットの行動を決定し、
前記新しい経験は、前記ロボットの前記行動による経験であり、
前記学習システムが、前記経験データベースからサンプリングした経験を使用して、バックプロパゲーションにより、前記ニューラルネットワークのパラメータを更新する、方法。 - 請求項8に記載の方法であって、
前記学習システムが、実ロボット端末に、前記ニューラルネットワークのパラメータを送信する、方法。 - 学習システムであって、
記憶装置と、
プロセッサと、
前記記憶装置は、経験データベースを格納し、
前記経験データベースは、機械学習において、エージェントの行動の評価値を決定する評価モデルを学習するために使用され、
前記プロセッサは、
前記エージェントの新しい経験を取得し、
前記新しい経験と前記経験データベースから取得された1以上の過去の経験との間の、類似度を決定し、
前記類似度に基づいて、前記新しい経験を前記経験データベースに格納するか決定する、学習システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017047791A JP2018151876A (ja) | 2017-03-13 | 2017-03-13 | 機械学習に使用される経験を格納する経験データベースを更新する方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017047791A JP2018151876A (ja) | 2017-03-13 | 2017-03-13 | 機械学習に使用される経験を格納する経験データベースを更新する方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018151876A JP2018151876A (ja) | 2018-09-27 |
JP2018151876A5 true JP2018151876A5 (ja) | 2020-03-05 |
Family
ID=63681775
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017047791A Pending JP2018151876A (ja) | 2017-03-13 | 2017-03-13 | 機械学習に使用される経験を格納する経験データベースを更新する方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2018151876A (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11775812B2 (en) | 2018-11-30 | 2023-10-03 | Samsung Electronics Co., Ltd. | Multi-task based lifelong learning |
CN109760046A (zh) * | 2018-12-27 | 2019-05-17 | 西北工业大学 | 基于强化学习的空间机器人捕获翻滚目标运动规划方法 |
JP7336856B2 (ja) * | 2019-03-01 | 2023-09-01 | 株式会社Preferred Networks | 情報処理装置、方法及びプログラム |
KR102338964B1 (ko) * | 2019-04-22 | 2021-12-14 | 서울대학교병원 | 학습 기반의 증상 및 질환 관리 장치 및 방법 |
KR102240442B1 (ko) * | 2019-04-30 | 2021-04-15 | 중앙대학교 산학협력단 | 심층 강화학습 기반 mmWave 차량 네트워크의 비디오 품질을 고려한 선제적 캐싱정책 학습 기법 및 그의 시스템 |
US11481634B2 (en) | 2019-08-29 | 2022-10-25 | The Boeing Company | Systems and methods for training a neural network to control an aircraft |
JP7357537B2 (ja) * | 2019-12-24 | 2023-10-06 | 本田技研工業株式会社 | 制御装置、制御装置の制御方法、プログラム、情報処理サーバ、情報処理方法、並びに制御システム |
CN111300390B (zh) * | 2020-03-20 | 2021-03-23 | 南栖仙策(南京)科技有限公司 | 基于蓄水池采样和双经验池的机械臂智能控制系统 |
JP7365967B2 (ja) * | 2020-05-27 | 2023-10-20 | 株式会社 日立産業制御ソリューションズ | 行動選択システム及び行動選択方法 |
US20230274168A1 (en) * | 2022-02-28 | 2023-08-31 | Advanced Micro Devices, Inc. | Quantifying the human-likeness of artificially intelligent agents using statistical methods and techniques |
CN118334383B (zh) * | 2024-06-13 | 2024-08-23 | 山东智航智能装备有限公司 | 一种变化检测样本更新方法及装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3232595B2 (ja) * | 1991-07-31 | 2001-11-26 | 豊田工機株式会社 | ニューラルネットワークの学習データ記憶装置 |
US20100023465A1 (en) * | 2006-10-19 | 2010-01-28 | Yukiko Kuroiwa | Active learning system, method and program |
US9014848B2 (en) * | 2010-05-20 | 2015-04-21 | Irobot Corporation | Mobile robot system |
JP5874292B2 (ja) * | 2011-10-12 | 2016-03-02 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
-
2017
- 2017-03-13 JP JP2017047791A patent/JP2018151876A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2018151876A5 (ja) | ||
JP2016523402A5 (ja) | ||
JP2016503216A5 (ja) | ||
JP2019125383A5 (ja) | ||
JP2021507323A5 (ja) | ||
JP6125108B1 (ja) | 仮想シナリオにおいてサウンドをシミュレートする方法および装置ならびに端末 | |
EP4270285A3 (en) | Intelligent agents for managing data associated with three-dimensional objects | |
JP2016501398A5 (ja) | ||
JP2018527634A5 (ja) | ||
JP2016505990A5 (ja) | ||
JP2016524190A5 (ja) | ||
SG10201808441TA (en) | Natural language processing artificial intelligence network and data security system | |
JP2018508874A5 (ja) | ||
JP2015146183A5 (ja) | ||
JP2017515205A5 (ja) | ||
JP2015167019A5 (ja) | ||
JP2014170552A5 (ja) | ||
JP2016508275A5 (ja) | ||
JP2009541882A5 (ja) | ||
RU2016150428A (ru) | Заполнение записей контактов пользователя | |
US10075695B2 (en) | Information processing method and device | |
CN109847366A (zh) | 用于游戏的数据处理方法和装置 | |
JP2017500646A5 (ja) | ||
JP2012518834A (ja) | ウェブサイト訪問者の評価値を計算するための方法及びシステム | |
EP2988229A1 (en) | Information retrieval method and device |