WO2022230019A1 - 学習装置、学習方法および学習プログラム

学習装置、学習方法および学習プログラム Download PDF

Info

Publication number: WO2022230019A1
Authority: WO; WIPO (PCT)
Prior art keywords: updating; likelihood; reward function; trajectory; regularization term
Prior art date: 2021-04-26
Legal status : Ceased

Application number

PCT/JP2021/016630

Other languages

Inventor

力江藤

Current Assignee

NEC Corp

Original Assignee

NEC Corp

Priority date

2021-04-26

Filing date

2021-04-26

Publication date

2022-11-03

2021-04-26 Application filed by NEC Corp filed Critical NEC Corp

2021-04-26 Priority to EP21939182.8A priority Critical patent/EP4332845A4/en

2021-04-26 Priority to JP2023516874A priority patent/JP7529144B2/ja

2021-04-26 Priority to US18/287,546 priority patent/US20240211767A1/en

2021-04-26 Priority to PCT/JP2021/016630 priority patent/WO2022230019A1/ja

2022-11-03 Publication of WO2022230019A1 publication Critical patent/WO2022230019A1/ja

2023-10-26 Anticipated expiration legal-status Critical

Status Ceased legal-status Critical Current