JP2023512722A - 適応リターン計算方式を用いた強化学習

Info

Publication number: JP2023512722A
Application number: JP2022548005A
Authority: JP
Inventors: アドリア・プイドメネチ・バディア; ビラル・ピオット; パブロ・スプレッヒマン; スティーヴン・ジェームズ・カプチュロヴスキ; アレックス・ヴィトヴィツキイ; ジャオハン・グオ; チャールズ・ブランデル
Original assignee: ディープマインドテクノロジーズリミテッド
Priority date: 2020-02-07
Filing date: 2021-02-08
Publication date: 2023-03-28
Also published as: CN115298668A; EP4100881A1; WO2021156518A1; KR20220137732A; US20230059004A1; CA3167201A1