JP2018151876A5 - - Google Patents

Download PDF

Info

Publication number
JP2018151876A5
JP2018151876A5 JP2017047791A JP2017047791A JP2018151876A5 JP 2018151876 A5 JP2018151876 A5 JP 2018151876A5 JP 2017047791 A JP2017047791 A JP 2017047791A JP 2017047791 A JP2017047791 A JP 2017047791A JP 2018151876 A5 JP2018151876 A5 JP 2018151876A5
Authority
JP
Japan
Prior art keywords
experience
learning system
experiences
similarity
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017047791A
Other languages
English (en)
Other versions
JP2018151876A (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2017047791A priority Critical patent/JP2018151876A/ja
Priority claimed from JP2017047791A external-priority patent/JP2018151876A/ja
Publication of JP2018151876A publication Critical patent/JP2018151876A/ja
Publication of JP2018151876A5 publication Critical patent/JP2018151876A5/ja
Pending legal-status Critical Current

Links

Claims (10)

  1. 機械学習に使用される経験を格納する経験データベース、を更新する方法であって、
    学習システムが、エージェントの新しい経験を取得し、
    前記学習システムが、前記新しい経験と前記経験データベースから取得された1以上の過去の経験との間の、類似度を決定し、
    前記経験データベースは、機械学習において、前記エージェントの行動の評価値を決定する評価モデルを学習するために使用され、
    前記学習システムが、前記類似度に基づいて、前記新しい経験を前記経験データベースに格納するか決定する、方法。
  2. 請求項1に記載の方法であって、
    前記学習システムが、前記新しい経験と前記経験データベースに格納されている全経験それぞれとの間の類似度の総計に基づいて、前記新しい経験を前記経験データベースに格納するか決定する、方法。
  3. 請求項1に記載の方法であって、
    前記学習システムが、前記経験データベースに格納されている既存経験の数が規定数に達している場合に、前記類似度に基づいて、前記新しい経験を前記経験データベースに格納するか決定する、方法。
  4. 請求項1に記載の方法であって、
    前記学習システムが、前記類似度と乱数とに基づいて、前記新しい経験を前記経験データベースに格納するか決定する、方法。
  5. 請求項1に記載の方法であって、
    前記学習システムが、前記経験データベースに格納されている既存経験の数が規定数に達している場合に、前記既存経験の格納順に基づいて、前記既存経験から削除する経験を選択する、方法。
  6. 請求項1に記載の方法であって、
    前記学習システムが、前記経験データベースに格納されている既存経験の数が規定数に達している場合に、前記既存経験間の類似度に基づいて、前記既存経験から削除する経験を選択する、方法。
  7. 請求項6に記載の方法であって、
    前記学習システムが、前記既存経験間の類似度を示すテーブルを参照して、前記既存経験間の類似度を決定し、
    前記経験データベースの更新に応じて、前記テーブルを更新する、方法。
  8. 請求項1に記載の方法であって、
    前記エージェントは仮想環境におけるロボットであり、
    前記学習システムが、ニューラルネットワークに基づいて、前記仮想環境において前記ロボットの行動を決定し、
    前記新しい経験は、前記ロボットの前記行動による経験であり、
    前記学習システムが、前記経験データベースからサンプリングした経験を使用して、バックプロパゲーションにより、前記ニューラルネットワークのパラメータを更新する、方法。
  9. 請求項8に記載の方法であって、
    前記学習システムが、実ロボット端末に、前記ニューラルネットワークのパラメータを送信する、方法。
  10. 学習システムであって、
    記憶装置と、
    プロセッサと、
    前記記憶装置は、経験データベースを格納し、
    前記経験データベースは、機械学習において、エージェントの行動の評価値を決定する評価モデルを学習するために使用され、
    前記プロセッサは、
    前記エージェントの新しい経験を取得し、
    前記新しい経験と前記経験データベースから取得された1以上の過去の経験との間の、類似度を決定し、
    前記類似度に基づいて、前記新しい経験を前記経験データベースに格納するか決定する、学習システム。
JP2017047791A 2017-03-13 2017-03-13 機械学習に使用される経験を格納する経験データベースを更新する方法 Pending JP2018151876A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017047791A JP2018151876A (ja) 2017-03-13 2017-03-13 機械学習に使用される経験を格納する経験データベースを更新する方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017047791A JP2018151876A (ja) 2017-03-13 2017-03-13 機械学習に使用される経験を格納する経験データベースを更新する方法

Publications (2)

Publication Number Publication Date
JP2018151876A JP2018151876A (ja) 2018-09-27
JP2018151876A5 true JP2018151876A5 (ja) 2020-03-05

Family

ID=63681775

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017047791A Pending JP2018151876A (ja) 2017-03-13 2017-03-13 機械学習に使用される経験を格納する経験データベースを更新する方法

Country Status (1)

Country Link
JP (1) JP2018151876A (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11775812B2 (en) 2018-11-30 2023-10-03 Samsung Electronics Co., Ltd. Multi-task based lifelong learning
CN109760046A (zh) * 2018-12-27 2019-05-17 西北工业大学 基于强化学习的空间机器人捕获翻滚目标运动规划方法
JP7336856B2 (ja) * 2019-03-01 2023-09-01 株式会社Preferred Networks 情報処理装置、方法及びプログラム
KR102338964B1 (ko) * 2019-04-22 2021-12-14 서울대학교병원 학습 기반의 증상 및 질환 관리 장치 및 방법
KR102240442B1 (ko) * 2019-04-30 2021-04-15 중앙대학교 산학협력단 심층 강화학습 기반 mmWave 차량 네트워크의 비디오 품질을 고려한 선제적 캐싱정책 학습 기법 및 그의 시스템
US11481634B2 (en) 2019-08-29 2022-10-25 The Boeing Company Systems and methods for training a neural network to control an aircraft
JP7357537B2 (ja) * 2019-12-24 2023-10-06 本田技研工業株式会社 制御装置、制御装置の制御方法、プログラム、情報処理サーバ、情報処理方法、並びに制御システム
CN111300390B (zh) * 2020-03-20 2021-03-23 南栖仙策(南京)科技有限公司 基于蓄水池采样和双经验池的机械臂智能控制系统
JP7365967B2 (ja) * 2020-05-27 2023-10-20 株式会社 日立産業制御ソリューションズ 行動選択システム及び行動選択方法
US20230274168A1 (en) * 2022-02-28 2023-08-31 Advanced Micro Devices, Inc. Quantifying the human-likeness of artificially intelligent agents using statistical methods and techniques
CN118334383B (zh) * 2024-06-13 2024-08-23 山东智航智能装备有限公司 一种变化检测样本更新方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3232595B2 (ja) * 1991-07-31 2001-11-26 豊田工機株式会社 ニューラルネットワークの学習データ記憶装置
US20100023465A1 (en) * 2006-10-19 2010-01-28 Yukiko Kuroiwa Active learning system, method and program
US9014848B2 (en) * 2010-05-20 2015-04-21 Irobot Corporation Mobile robot system
JP5874292B2 (ja) * 2011-10-12 2016-03-02 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム

Similar Documents

Publication Publication Date Title
JP2018151876A5 (ja)
JP2016523402A5 (ja)
JP2016503216A5 (ja)
JP2019125383A5 (ja)
JP2021507323A5 (ja)
JP6125108B1 (ja) 仮想シナリオにおいてサウンドをシミュレートする方法および装置ならびに端末
EP4270285A3 (en) Intelligent agents for managing data associated with three-dimensional objects
JP2016501398A5 (ja)
JP2018527634A5 (ja)
JP2016505990A5 (ja)
JP2016524190A5 (ja)
SG10201808441TA (en) Natural language processing artificial intelligence network and data security system
JP2018508874A5 (ja)
JP2015146183A5 (ja)
JP2017515205A5 (ja)
JP2015167019A5 (ja)
JP2014170552A5 (ja)
JP2016508275A5 (ja)
JP2009541882A5 (ja)
RU2016150428A (ru) Заполнение записей контактов пользователя
US10075695B2 (en) Information processing method and device
CN109847366A (zh) 用于游戏的数据处理方法和装置
JP2017500646A5 (ja)
JP2012518834A (ja) ウェブサイト訪問者の評価値を計算するための方法及びシステム
EP2988229A1 (en) Information retrieval method and device