WO2022250689A1

WO2022250689A1 - Reconnaissance d'action vidéo progressive à l'aide d'attributs de scène

Info

Publication number: WO2022250689A1
Application number: PCT/US2021/034779
Authority: WO
Inventors: Jenhao Hsiao; Jiawei Chen
Original assignee: Innopeak Technology, Inc.
Priority date: 2021-05-28
Filing date: 2021-05-28
Publication date: 2022-12-01

Abstract

Selon l'invention, un système informatique obtient un contenu vidéo qui comprend une pluralité de trames d'image et groupe la pluralité de trames d'image en une pluralité de segments vidéo successifs. Le dispositif génère une pluralité de descripteurs de séquences pour les segments vidéo du contenu vidéo à l'aide d'un réseau d'attribut. Chaque segment vidéo correspond à un descripteur de séquence respectif qui comprend: (i) un premier sous-ensemble d'éléments caractéristiques qui indiquent un ou plusieurs concepts visuels du segment vidéo considéré et (ii) un second sous-ensemble d'éléments caractéristiques qui sont associés à une pluralité de caractéristiques visuelles extraites du segment vidéo considéré. Les descripteurs de la pluralité de descripteurs de séquences des segments vidéo sont fusionnés entre eux pour former un descripteur de vidéo à l'aide d'un réseau neuronal d'actions, et une action vidéo du contenu vidéo est déterminée à partir du descripteur de vidéo à l'aide d'une couche de classification d'action.