WO2021248859A1

WO2021248859A1 - Procédé et appareil de classification vidéo, ainsi que dispositif et support de stockage lisible par ordinateur

Info

Publication number: WO2021248859A1
Application number: PCT/CN2020/134995
Authority: WO
Inventors: 乔宇; 王亚立; 李先航; 周志鹏; 邹静
Original assignee: 中国科学院深圳先进技术研究院
Priority date: 2020-06-11
Filing date: 2020-12-09
Publication date: 2021-12-16
Also published as: WO2021248859A9; CN111859023B; CN111859023A

Abstract

La présente invention concerne un procédé et un appareil de classification vidéo, ainsi qu'un dispositif et un support de stockage lisible par ordinateur. Le procédé de classification vidéo consiste : à obtenir une vidéo à classifier, ladite vidéo comprenant de multiples trames vidéo (S301) ; et à entrer ladite vidéo dans un modèle de classification de vidéo formé pour un traitement et à délivrer en sortie un résultat de classification de ladite vidéo, le modèle de classification vidéo comprenant une couche d'extraction de caractéristiques et une couche complètement connectée, la couche d'extraction de caractéristiques étant utilisée pour extraire des informations de caractéristiques spatiales au moyen d'une convolution bidimensionnelle, à extraire des informations de caractéristiques temporelles au moyen d'une mise en commun et à fusionner les informations de caractéristiques spatiales et les informations de caractéristiques temporelles pour délivrer en sortie des informations de caractéristiques fusionnées, et la couche complètement connectée étant utilisée pour effectuer un traitement de connexion complet sur les informations de caractéristiques fusionnées pour obtenir le résultat de classification (S302). Selon le procédé, par rapport au calcul d'un noyau de convolution tridimensionnel, des informations de caractéristiques d'une dimension temporelle de ladite vidéo sont obtenues par regroupement et la convolution bidimensionnelle utilisée peut réduire considérablement le calcul de paramètres de convolution, ce qui facilite la réduction de la complexité de calcul de la classification vidéo.