WO2017004626A1

WO2017004626A1 - Systèmes et procédés permettant de fournir un apprentissage par renforcement dans un système d'apprentissage en profondeur

Info

Publication number: WO2017004626A1
Application number: PCT/US2016/042631
Authority: WO
Inventors: Ian David Moffat OSBAND; Benjamin Van Roy
Original assignee: The Board Of Trustees Of The Leland Stanford Junior University
Priority date: 2015-07-01
Filing date: 2016-07-15
Publication date: 2017-01-05

Abstract

L'invention concerne des systèmes et des procédés permettant de fournir un apprentissage par renforcement pour un réseau d'apprentissage en profondeur. Un processus d'apprentissage par renforcement, qui permet une exploration profonde, est fourni par une amorce appliquée à un échantillon de données observées et artificielles afin de faciliter une exploration profonde au moyen d'une technique d'échantillonnage de Thompson.