WO2023216609A1

WO2023216609A1 - Procédé et appareil de reconnaissance de comportement cible basés sur une fusion de caractéristiques audiovisuelles, et application

Info

Publication number: WO2023216609A1
Application number: PCT/CN2022/141314
Authority: WO
Inventors: 毛云青; 王国梁; 齐韬; 陈思瑶; 葛俊
Original assignee: 城云科技（中国）有限公司
Priority date: 2022-05-09
Filing date: 2022-12-23
Publication date: 2023-11-16
Also published as: CN114581749A; CN114581749B

Abstract

Procédé et appareil de reconnaissance de comportement cible basés sur une fusion de caractéristiques audiovisuelles, et application, qui se rapportent au domaine technique de la protection de sécurité intelligente. Dans le procédé, des informations visuelles et des informations audio sont entrées dans un réseau d'algorithmes spécifié, une caractéristique visuelle et une caractéristique audio sont extraites par l'intermédiaire de différents réseaux d'extraction de caractéristiques de deux branches, et des caractéristiques de synchronisation sont calculées par l'intermédiaire d'un réseau LSTM ; et un sous-espace sémantique partagé est construit au moyen d'un réseau d'auto-codage, une polarisation sémantique entre la caractéristique visuelle et la caractéristique audio est éliminée, et enfin, la caractéristique visuelle et la caractéristique audio sont fusionnées, de telle sorte qu'un comportement cible peut être reconnu sur la base d'une caractéristique fusionnée. Le procédé peut améliorer la précision de reconnaissance de comportement anormal.