WO2024001057A1

WO2024001057A1 - Procédé de récupération vidéo basé sur une invite de segment d'attention

Info

Publication number: WO2024001057A1
Application number: PCT/CN2022/137814
Authority: WO
Inventors: 乔宇; 陈思然; 许清林; 王亚立; 马跃
Original assignee: 深圳先进技术研究院
Priority date: 2022-07-01
Filing date: 2022-12-09
Publication date: 2024-01-04
Also published as: CN115269913A

Abstract

La présente invention divulgue un procédé de récupération de vidéo basé sur une invite de segment d'attention. Le procédé consiste à : extraire des informations visuelles pour une vidéo, calculer une caractéristique globale correspondante et extraire une caractéristique de texte d'après un texte d'interrogation ; utiliser un convertisseur temporel pour les informations visuelles de sorte que la caractéristique de chaque trame comporte des informations contextuelles ; rechercher des clips vidéo similaires dans la vidéo d'après la caractéristique de texte et acquérir les informations de clip vidéo les plus similaires au texte de requête en tant que caractéristique visuelle clé ; effectuer une somme pondérée sur la caractéristique clé et la caractéristique globale afin d'obtenir une caractéristique visuelle finale ; et calculer une similarité entre le texte de requête et la vidéo en fonction de la caractéristique visuelle finale de façon à récupérer une vidéo cible satisfaisant une exigence de similarité. Selon la présente invention, une plus grande importance est accordée à l'écran le plus pertinent, tandis que les informations globales sont réservées, de sorte que la vidéo cible peut être récupérée avec précision.