WO2023064074A1

WO2023064074A1 - Interactions d'agents multimodaux préparés

Info

Publication number: WO2023064074A1
Application number: PCT/US2022/044303
Authority: WO
Inventors: William B. Dolan; Christopher John Brockett; Ryan VOLUM; Gabriel A. Desgarennes; Sudha RAO
Original assignee: Microsoft Technology Licensing, Llc.
Priority date: 2021-10-14
Filing date: 2022-09-22
Publication date: 2023-04-20

Abstract

Des aspects de la présente divulgation concernent des interactions d'agents multimodaux préparés, une entrée d'utilisateur étant traitée à l'aide d'un modèle d'apprentissage machine multimodal pour générer une sortie de modèle. La sortie de modèle peut ensuite être traitée pour affecter le comportement d'une application, par exemple pour permettre à un utilisateur de commander l'application et/ou de faciliter des interactions d'utilisateur avec un agent conversationnel, entre autres exemples. Dans certains cas, au moins une partie de la sortie de modèle peut être exécutée ou analysée, par exemple pour appeler une interface de programmation d'application ou une fonction de l'application. Ainsi, l'utilisation d'un modèle d'apprentissage machine multimodal selon des aspects décrits dans la description peut permettre l'utilisation d'une entrée en langage naturel fournie par l'utilisateur pour affecter le comportement d'une application en conséquence.