WO2020221278A1

WO2020221278A1 - Procédé d'entraînement de modèles, procédé de classification de vidéos, appareil associé, et dispositif électronique

Info

Publication number: WO2020221278A1
Application number: PCT/CN2020/087690
Authority: WO
Inventors: 苏驰; 李凯; 陈宜航; 刘弘也
Original assignee: 北京金山云网络技术有限公司; 北京金山云科技有限公司
Priority date: 2019-04-29
Filing date: 2020-04-29
Publication date: 2020-11-05
Also published as: CN110070067A; CN110070067B

Abstract

La présente invention concerne un procédé de classification de vidéos, un procédé d'entraînement de modèles, un appareil associé, et un dispositif électronique. Le procédé d'entraînement consiste à : extraire des caractéristiques initiales d'une pluralité de trames vidéo au moyen d'un réseau de neurones convolutif ; extraire des caractéristiques finales de la pluralité de trames vidéo à partir des caractéristiques initiales au moyen d'un réseau de neurones récurrent ; entrer les caractéristiques finales dans un réseau de sortie, et émettre un résultat de prédiction de la pluralité de trames vidéo ; déterminer une valeur de perte du résultat de prédiction au moyen d'une fonction de perte prédite prédéfinie ; et entraîner un modèle initial en fonction de la valeur de perte jusqu'à ce qu'un paramètre dans le modèle initial converge, et obtenir un modèle de classification de vidéos. Selon la présente invention, le réseau de neurones convolutif et le réseau neuronal récurrent sont combinés, de telle sorte qu'une quantité de fonctionnement peut être fortement réduite, ce qui permet d'améliorer l'entraînement de modèles et l'efficacité de reconnaissance ; et en même temps, des informations d'association entre les trames vidéo peuvent être prises en considération dans un processus d'extraction de caractéristiques, de telle sorte que les caractéristiques extraites peuvent représenter avec précision les types de vidéos, et la précision de la classification de vidéos est améliorée.