JP5874292B2 - 情報処理装置、情報処理方法、及びプログラム - Google Patents

情報処理装置、情報処理方法、及びプログラム Download PDF

Info

Publication number
JP5874292B2
JP5874292B2 JP2011224638A JP2011224638A JP5874292B2 JP 5874292 B2 JP5874292 B2 JP 5874292B2 JP 2011224638 A JP2011224638 A JP 2011224638A JP 2011224638 A JP2011224638 A JP 2011224638A JP 5874292 B2 JP5874292 B2 JP 5874292B2
Authority
JP
Japan
Prior art keywords
data
action
reward
state
agent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011224638A
Other languages
English (en)
Japanese (ja)
Other versions
JP2013084175A5 (enExample
JP2013084175A (ja
Inventor
由幸 小林
由幸 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2011224638A priority Critical patent/JP5874292B2/ja
Priority to US13/616,988 priority patent/US9082081B2/en
Publication of JP2013084175A publication Critical patent/JP2013084175A/ja
Publication of JP2013084175A5 publication Critical patent/JP2013084175A5/ja
Priority to US14/738,522 priority patent/US10282665B2/en
Application granted granted Critical
Publication of JP5874292B2 publication Critical patent/JP5874292B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
JP2011224638A 2011-10-12 2011-10-12 情報処理装置、情報処理方法、及びプログラム Expired - Fee Related JP5874292B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2011224638A JP5874292B2 (ja) 2011-10-12 2011-10-12 情報処理装置、情報処理方法、及びプログラム
US13/616,988 US9082081B2 (en) 2011-10-12 2012-09-14 Information processing apparatus, information processing method, and program
US14/738,522 US10282665B2 (en) 2011-10-12 2015-06-12 Action selection with a reward estimator applied to machine learning

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011224638A JP5874292B2 (ja) 2011-10-12 2011-10-12 情報処理装置、情報処理方法、及びプログラム

Publications (3)

Publication Number Publication Date
JP2013084175A JP2013084175A (ja) 2013-05-09
JP2013084175A5 JP2013084175A5 (enExample) 2014-11-13
JP5874292B2 true JP5874292B2 (ja) 2016-03-02

Family

ID=48529293

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011224638A Expired - Fee Related JP5874292B2 (ja) 2011-10-12 2011-10-12 情報処理装置、情報処理方法、及びプログラム

Country Status (2)

Country Link
US (2) US9082081B2 (enExample)
JP (1) JP5874292B2 (enExample)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020178908A (ja) * 2019-04-25 2020-11-05 株式会社コナミアミューズメント ゲーム装置、ゲームシステム、ゲーム装置の動作方法およびプログラム

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5874292B2 (ja) * 2011-10-12 2016-03-02 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
JP5815458B2 (ja) * 2012-04-20 2015-11-17 日本電信電話株式会社 報酬関数推定装置、報酬関数推定方法、およびプログラム
JP6259428B2 (ja) * 2015-07-31 2018-01-10 ファナック株式会社 機械指令に応じたフィルタを学習する機械学習装置、機械学習装置を備えたモータ駆動装置及びモータ駆動システム並びに機械学習方法
JP6551101B2 (ja) * 2015-09-17 2019-07-31 日本電気株式会社 情報処理装置、情報処理方法、及び、プログラム
JP2018005739A (ja) * 2016-07-06 2018-01-11 株式会社デンソー ニューラルネットワークの強化学習方法及び強化学習装置
JP6351671B2 (ja) * 2016-08-26 2018-07-04 株式会社 ディー・エヌ・エー ニューロエボリューションを用いたニューラルネットワークの構造及びパラメータ調整のためのプログラム、システム、及び方法
CN117521725A (zh) * 2016-11-04 2024-02-06 渊慧科技有限公司 加强学习系统
JP6782679B2 (ja) * 2016-12-06 2020-11-11 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 情報処理装置、情報処理方法及びプログラム
WO2018105320A1 (ja) * 2016-12-06 2018-06-14 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 情報処理装置、情報処理方法及びプログラム
EP3553711A4 (en) * 2016-12-07 2019-12-25 Sony Corporation INFORMATION PROCESSING DEVICE AND METHOD AND PROGRAM
EP3586277B1 (en) * 2017-02-24 2024-04-03 Google LLC Training policy neural networks using path consistency learning
JP2018151876A (ja) * 2017-03-13 2018-09-27 株式会社日立製作所 機械学習に使用される経験を格納する経験データベースを更新する方法
WO2019049210A1 (ja) * 2017-09-05 2019-03-14 楽天株式会社 推定システム、推定方法及びプログラム
US10510010B1 (en) * 2017-10-11 2019-12-17 Liquid Biosciences, Inc. Methods for automatically generating accurate models in reduced time
WO2019087478A1 (ja) * 2017-10-30 2019-05-09 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
CN108211362B (zh) * 2017-12-26 2020-10-09 浙江大学 一种基于深度q学习网络的非玩家角色战斗策略学习方法
JP2019118461A (ja) * 2017-12-28 2019-07-22 株式会社 ディー・エヌ・エー 情報処理装置及び情報処理プログラム
JP6963511B2 (ja) * 2018-01-12 2021-11-10 株式会社日立製作所 解探索処理装置および解探索処理方法
CN111919223B (zh) * 2018-03-26 2024-07-02 平衡媒体技术有限责任公司 用于机器学习算法游戏化的抽象接口
CN109905271B (zh) * 2018-05-18 2021-01-12 华为技术有限公司 一种预测方法、训练方法、装置及计算机存储介质
US20210260482A1 (en) * 2018-06-29 2021-08-26 Sony Corporation Information processing device and information processing method
JP6965314B2 (ja) * 2018-08-21 2021-11-10 グリー株式会社 プログラム、情報処理装置及び制御方法
JP7187961B2 (ja) * 2018-10-12 2022-12-13 富士通株式会社 強化学習プログラム、強化学習方法、および強化学習装置
KR102079745B1 (ko) * 2019-07-09 2020-04-07 (주) 시큐레이어 인공지능 에이전트의 훈련 방법, 이에 기반한 사용자 액션의 추천 방법 및 이를 이용한 장치
KR102861743B1 (ko) 2019-09-13 2025-09-18 딥마인드 테크놀로지스 리미티드 데이터 기반 로봇 제어
CN110852436B (zh) * 2019-10-18 2023-08-01 桂林力港网络科技股份有限公司 一种电子扑克游戏的数据处理方法、装置及存储介质
US11717748B2 (en) * 2019-11-19 2023-08-08 Valve Corporation Latency compensation using machine-learned prediction of user input
JP6861309B1 (ja) * 2020-03-11 2021-04-21 株式会社メルカリ システム、情報処理方法及びプログラム
JP7417451B2 (ja) * 2020-03-24 2024-01-18 株式会社 ディー・エヌ・エー 電子ゲーム情報処理装置及び電子ゲーム情報処理プログラム
CN112870722B (zh) * 2021-03-11 2022-07-22 腾讯科技(深圳)有限公司 对战格斗类ai游戏模型的生成方法、装置、设备及介质
JP2024005890A (ja) * 2022-06-30 2024-01-17 本田技研工業株式会社 学習装置、および学習方法
JP7680403B2 (ja) * 2022-08-22 2025-05-20 大器 日下 ゲームシステム
JPWO2024171312A1 (enExample) * 2023-02-14 2024-08-22
CN116747521B (zh) * 2023-08-17 2023-11-03 腾讯科技(深圳)有限公司 控制智能体进行对局的方法、装置、设备及存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060247973A1 (en) * 2000-11-14 2006-11-02 Mueller Raymond J Method and apparatus for dynamic rule and/or offer generation
US7403904B2 (en) * 2002-07-19 2008-07-22 International Business Machines Corporation System and method for sequential decision making for customer relationship management
US8990688B2 (en) * 2003-09-05 2015-03-24 Samsung Electronics Co., Ltd. Proactive user interface including evolving agent
US20070002140A1 (en) * 2005-05-03 2007-01-04 Greg Benson Trusted monitoring system and method
JP5070860B2 (ja) * 2007-01-31 2012-11-14 ソニー株式会社 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP4392620B2 (ja) 2007-08-14 2010-01-06 ソニー株式会社 情報処理装置、情報処理方法、演算装置、演算方法、プログラム、および記録媒体
DE102008007700A1 (de) * 2007-10-31 2009-05-07 Siemens Aktiengesellschaft Verfahren zur rechnergestützten Exploration von Zuständen eines technischen Systems
JP5909943B2 (ja) * 2011-09-08 2016-04-27 ソニー株式会社 情報処理装置、推定機生成方法、及びプログラム
JP5874292B2 (ja) * 2011-10-12 2016-03-02 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020178908A (ja) * 2019-04-25 2020-11-05 株式会社コナミアミューズメント ゲーム装置、ゲームシステム、ゲーム装置の動作方法およびプログラム
JP7419635B2 (ja) 2019-04-25 2024-01-23 株式会社コナミアミューズメント ゲームシステム、制御システム、制御方法およびプログラム
JP2024023704A (ja) * 2019-04-25 2024-02-21 株式会社コナミアミューズメント ゲーム装置、ゲームシステム、ゲーム装置の動作方法およびプログラム
JP7619678B2 (ja) 2019-04-25 2025-01-22 株式会社コナミアミューズメント ゲームシステム、制御方法およびプログラム

Also Published As

Publication number Publication date
US10282665B2 (en) 2019-05-07
US20150278694A1 (en) 2015-10-01
US20130246318A1 (en) 2013-09-19
US9082081B2 (en) 2015-07-14
JP2013084175A (ja) 2013-05-09

Similar Documents

Publication Publication Date Title
JP5874292B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP5879899B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP7399277B2 (ja) 情報処理方法、装置、コンピュータプログラム及び電子装置
Mnih et al. Playing atari with deep reinforcement learning
Lin et al. Juewu-mc: Playing minecraft with sample-efficient hierarchical reinforcement learning
JP2022502112A (ja) 仮想環境における仮想対象のスケジューリング方法、装置、デバイス及びコンピュータプログラム
Mohanty et al. Measuring sample efficiency and generalization in reinforcement learning benchmarks: Neurips 2020 procgen benchmark
Zhang et al. Improving hearthstone AI by learning high-level rollout policies and bucketing chance node events
Janusz et al. Helping ai to play hearthstone: Aaia'17 data mining challenge
Wang et al. Efficientzero v2: Mastering discrete and continuous control with limited data
Zhou et al. A swarm intelligence assisted iot-based activity recognition system for basketball rookies
Zhou et al. Discovering of game AIs’ characters using a neural network based AI imitator for AI clustering
Chole et al. Locust Mayfly optimization-tuned neural network for AI-based pruning in Chess game
Baek et al. 3-Dimensional convolutional neural networks for predicting StarCraft Ⅱ results and extracting key game situations
Cai et al. Evolutionary swarm neural network game engine for Capture Go
Gonzalez Enhanced Monte Carlo Tree Search in Game-Playing AI: Evaluating Deepmind's Algorithms
Lin et al. Perceptual similarity for measuring decision-making style and policy diversity in games
CN114272611A (zh) 一种神经网络模型的训练方法、装置、设备以及存储介质
Dukkancı Level generation using genetic algorithms and difficulty testing using reinforcement learning in match-3 game
Czupyt et al. Capitalizing on the Opponent's Uncertainty in Reconnaissance Blind Chess
Chang et al. Construction of macro actions for deep reinforcement learning
Piccolo A systematic literature review of neuroevolution in games
Cui et al. Comparing the Effectiveness of PPO and its Variants in Training AI to Play Game
Liu et al. Naruto mobile: Ai sparring partner using heterogeneous deep reinforcement learning
US10857460B2 (en) Socially-driven modeling systems and methods

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140929

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140929

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160104

R151 Written notification of patent or utility model registration

Ref document number: 5874292

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees