JP5874292B2 - 情報処理装置、情報処理方法、及びプログラム - Google Patents
情報処理装置、情報処理方法、及びプログラム Download PDFInfo
- Publication number
- JP5874292B2 JP5874292B2 JP2011224638A JP2011224638A JP5874292B2 JP 5874292 B2 JP5874292 B2 JP 5874292B2 JP 2011224638 A JP2011224638 A JP 2011224638A JP 2011224638 A JP2011224638 A JP 2011224638A JP 5874292 B2 JP5874292 B2 JP 5874292B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- action
- reward
- state
- agent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2011224638A JP5874292B2 (ja) | 2011-10-12 | 2011-10-12 | 情報処理装置、情報処理方法、及びプログラム |
| US13/616,988 US9082081B2 (en) | 2011-10-12 | 2012-09-14 | Information processing apparatus, information processing method, and program |
| US14/738,522 US10282665B2 (en) | 2011-10-12 | 2015-06-12 | Action selection with a reward estimator applied to machine learning |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2011224638A JP5874292B2 (ja) | 2011-10-12 | 2011-10-12 | 情報処理装置、情報処理方法、及びプログラム |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2013084175A JP2013084175A (ja) | 2013-05-09 |
| JP2013084175A5 JP2013084175A5 (enExample) | 2014-11-13 |
| JP5874292B2 true JP5874292B2 (ja) | 2016-03-02 |
Family
ID=48529293
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2011224638A Expired - Fee Related JP5874292B2 (ja) | 2011-10-12 | 2011-10-12 | 情報処理装置、情報処理方法、及びプログラム |
Country Status (2)
| Country | Link |
|---|---|
| US (2) | US9082081B2 (enExample) |
| JP (1) | JP5874292B2 (enExample) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2020178908A (ja) * | 2019-04-25 | 2020-11-05 | 株式会社コナミアミューズメント | ゲーム装置、ゲームシステム、ゲーム装置の動作方法およびプログラム |
Families Citing this family (34)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5874292B2 (ja) * | 2011-10-12 | 2016-03-02 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
| JP5815458B2 (ja) * | 2012-04-20 | 2015-11-17 | 日本電信電話株式会社 | 報酬関数推定装置、報酬関数推定方法、およびプログラム |
| JP6259428B2 (ja) * | 2015-07-31 | 2018-01-10 | ファナック株式会社 | 機械指令に応じたフィルタを学習する機械学習装置、機械学習装置を備えたモータ駆動装置及びモータ駆動システム並びに機械学習方法 |
| JP6551101B2 (ja) * | 2015-09-17 | 2019-07-31 | 日本電気株式会社 | 情報処理装置、情報処理方法、及び、プログラム |
| JP2018005739A (ja) * | 2016-07-06 | 2018-01-11 | 株式会社デンソー | ニューラルネットワークの強化学習方法及び強化学習装置 |
| JP6351671B2 (ja) * | 2016-08-26 | 2018-07-04 | 株式会社 ディー・エヌ・エー | ニューロエボリューションを用いたニューラルネットワークの構造及びパラメータ調整のためのプログラム、システム、及び方法 |
| CN117521725A (zh) * | 2016-11-04 | 2024-02-06 | 渊慧科技有限公司 | 加强学习系统 |
| JP6782679B2 (ja) * | 2016-12-06 | 2020-11-11 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 情報処理装置、情報処理方法及びプログラム |
| WO2018105320A1 (ja) * | 2016-12-06 | 2018-06-14 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 情報処理装置、情報処理方法及びプログラム |
| EP3553711A4 (en) * | 2016-12-07 | 2019-12-25 | Sony Corporation | INFORMATION PROCESSING DEVICE AND METHOD AND PROGRAM |
| EP3586277B1 (en) * | 2017-02-24 | 2024-04-03 | Google LLC | Training policy neural networks using path consistency learning |
| JP2018151876A (ja) * | 2017-03-13 | 2018-09-27 | 株式会社日立製作所 | 機械学習に使用される経験を格納する経験データベースを更新する方法 |
| WO2019049210A1 (ja) * | 2017-09-05 | 2019-03-14 | 楽天株式会社 | 推定システム、推定方法及びプログラム |
| US10510010B1 (en) * | 2017-10-11 | 2019-12-17 | Liquid Biosciences, Inc. | Methods for automatically generating accurate models in reduced time |
| WO2019087478A1 (ja) * | 2017-10-30 | 2019-05-09 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
| CN108211362B (zh) * | 2017-12-26 | 2020-10-09 | 浙江大学 | 一种基于深度q学习网络的非玩家角色战斗策略学习方法 |
| JP2019118461A (ja) * | 2017-12-28 | 2019-07-22 | 株式会社 ディー・エヌ・エー | 情報処理装置及び情報処理プログラム |
| JP6963511B2 (ja) * | 2018-01-12 | 2021-11-10 | 株式会社日立製作所 | 解探索処理装置および解探索処理方法 |
| CN111919223B (zh) * | 2018-03-26 | 2024-07-02 | 平衡媒体技术有限责任公司 | 用于机器学习算法游戏化的抽象接口 |
| CN109905271B (zh) * | 2018-05-18 | 2021-01-12 | 华为技术有限公司 | 一种预测方法、训练方法、装置及计算机存储介质 |
| US20210260482A1 (en) * | 2018-06-29 | 2021-08-26 | Sony Corporation | Information processing device and information processing method |
| JP6965314B2 (ja) * | 2018-08-21 | 2021-11-10 | グリー株式会社 | プログラム、情報処理装置及び制御方法 |
| JP7187961B2 (ja) * | 2018-10-12 | 2022-12-13 | 富士通株式会社 | 強化学習プログラム、強化学習方法、および強化学習装置 |
| KR102079745B1 (ko) * | 2019-07-09 | 2020-04-07 | (주) 시큐레이어 | 인공지능 에이전트의 훈련 방법, 이에 기반한 사용자 액션의 추천 방법 및 이를 이용한 장치 |
| KR102861743B1 (ko) | 2019-09-13 | 2025-09-18 | 딥마인드 테크놀로지스 리미티드 | 데이터 기반 로봇 제어 |
| CN110852436B (zh) * | 2019-10-18 | 2023-08-01 | 桂林力港网络科技股份有限公司 | 一种电子扑克游戏的数据处理方法、装置及存储介质 |
| US11717748B2 (en) * | 2019-11-19 | 2023-08-08 | Valve Corporation | Latency compensation using machine-learned prediction of user input |
| JP6861309B1 (ja) * | 2020-03-11 | 2021-04-21 | 株式会社メルカリ | システム、情報処理方法及びプログラム |
| JP7417451B2 (ja) * | 2020-03-24 | 2024-01-18 | 株式会社 ディー・エヌ・エー | 電子ゲーム情報処理装置及び電子ゲーム情報処理プログラム |
| CN112870722B (zh) * | 2021-03-11 | 2022-07-22 | 腾讯科技(深圳)有限公司 | 对战格斗类ai游戏模型的生成方法、装置、设备及介质 |
| JP2024005890A (ja) * | 2022-06-30 | 2024-01-17 | 本田技研工業株式会社 | 学習装置、および学習方法 |
| JP7680403B2 (ja) * | 2022-08-22 | 2025-05-20 | 大器 日下 | ゲームシステム |
| JPWO2024171312A1 (enExample) * | 2023-02-14 | 2024-08-22 | ||
| CN116747521B (zh) * | 2023-08-17 | 2023-11-03 | 腾讯科技(深圳)有限公司 | 控制智能体进行对局的方法、装置、设备及存储介质 |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20060247973A1 (en) * | 2000-11-14 | 2006-11-02 | Mueller Raymond J | Method and apparatus for dynamic rule and/or offer generation |
| US7403904B2 (en) * | 2002-07-19 | 2008-07-22 | International Business Machines Corporation | System and method for sequential decision making for customer relationship management |
| US8990688B2 (en) * | 2003-09-05 | 2015-03-24 | Samsung Electronics Co., Ltd. | Proactive user interface including evolving agent |
| US20070002140A1 (en) * | 2005-05-03 | 2007-01-04 | Greg Benson | Trusted monitoring system and method |
| JP5070860B2 (ja) * | 2007-01-31 | 2012-11-14 | ソニー株式会社 | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
| JP4392620B2 (ja) | 2007-08-14 | 2010-01-06 | ソニー株式会社 | 情報処理装置、情報処理方法、演算装置、演算方法、プログラム、および記録媒体 |
| DE102008007700A1 (de) * | 2007-10-31 | 2009-05-07 | Siemens Aktiengesellschaft | Verfahren zur rechnergestützten Exploration von Zuständen eines technischen Systems |
| JP5909943B2 (ja) * | 2011-09-08 | 2016-04-27 | ソニー株式会社 | 情報処理装置、推定機生成方法、及びプログラム |
| JP5874292B2 (ja) * | 2011-10-12 | 2016-03-02 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
-
2011
- 2011-10-12 JP JP2011224638A patent/JP5874292B2/ja not_active Expired - Fee Related
-
2012
- 2012-09-14 US US13/616,988 patent/US9082081B2/en not_active Expired - Fee Related
-
2015
- 2015-06-12 US US14/738,522 patent/US10282665B2/en not_active Expired - Fee Related
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2020178908A (ja) * | 2019-04-25 | 2020-11-05 | 株式会社コナミアミューズメント | ゲーム装置、ゲームシステム、ゲーム装置の動作方法およびプログラム |
| JP7419635B2 (ja) | 2019-04-25 | 2024-01-23 | 株式会社コナミアミューズメント | ゲームシステム、制御システム、制御方法およびプログラム |
| JP2024023704A (ja) * | 2019-04-25 | 2024-02-21 | 株式会社コナミアミューズメント | ゲーム装置、ゲームシステム、ゲーム装置の動作方法およびプログラム |
| JP7619678B2 (ja) | 2019-04-25 | 2025-01-22 | 株式会社コナミアミューズメント | ゲームシステム、制御方法およびプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| US10282665B2 (en) | 2019-05-07 |
| US20150278694A1 (en) | 2015-10-01 |
| US20130246318A1 (en) | 2013-09-19 |
| US9082081B2 (en) | 2015-07-14 |
| JP2013084175A (ja) | 2013-05-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5874292B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
| JP5879899B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
| JP7399277B2 (ja) | 情報処理方法、装置、コンピュータプログラム及び電子装置 | |
| Mnih et al. | Playing atari with deep reinforcement learning | |
| Lin et al. | Juewu-mc: Playing minecraft with sample-efficient hierarchical reinforcement learning | |
| JP2022502112A (ja) | 仮想環境における仮想対象のスケジューリング方法、装置、デバイス及びコンピュータプログラム | |
| Mohanty et al. | Measuring sample efficiency and generalization in reinforcement learning benchmarks: Neurips 2020 procgen benchmark | |
| Zhang et al. | Improving hearthstone AI by learning high-level rollout policies and bucketing chance node events | |
| Janusz et al. | Helping ai to play hearthstone: Aaia'17 data mining challenge | |
| Wang et al. | Efficientzero v2: Mastering discrete and continuous control with limited data | |
| Zhou et al. | A swarm intelligence assisted iot-based activity recognition system for basketball rookies | |
| Zhou et al. | Discovering of game AIs’ characters using a neural network based AI imitator for AI clustering | |
| Chole et al. | Locust Mayfly optimization-tuned neural network for AI-based pruning in Chess game | |
| Baek et al. | 3-Dimensional convolutional neural networks for predicting StarCraft Ⅱ results and extracting key game situations | |
| Cai et al. | Evolutionary swarm neural network game engine for Capture Go | |
| Gonzalez | Enhanced Monte Carlo Tree Search in Game-Playing AI: Evaluating Deepmind's Algorithms | |
| Lin et al. | Perceptual similarity for measuring decision-making style and policy diversity in games | |
| CN114272611A (zh) | 一种神经网络模型的训练方法、装置、设备以及存储介质 | |
| Dukkancı | Level generation using genetic algorithms and difficulty testing using reinforcement learning in match-3 game | |
| Czupyt et al. | Capitalizing on the Opponent's Uncertainty in Reconnaissance Blind Chess | |
| Chang et al. | Construction of macro actions for deep reinforcement learning | |
| Piccolo | A systematic literature review of neuroevolution in games | |
| Cui et al. | Comparing the Effectiveness of PPO and its Variants in Training AI to Play Game | |
| Liu et al. | Naruto mobile: Ai sparring partner using heterogeneous deep reinforcement learning | |
| US10857460B2 (en) | Socially-driven modeling systems and methods |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140929 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140929 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151222 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160104 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 5874292 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |