WO2009147116A1

WO2009147116A1 - Systeme de videosurveillance intelligent reconfigurable dynamiquement.

Info

Publication number: WO2009147116A1
Application number: PCT/EP2009/056684
Authority: WO
Inventors: Marc Leny; Cédric LE BARZ; Didier Nicholson
Original assignee: Thales
Priority date: 2008-06-03
Filing date: 2009-05-29
Publication date: 2009-12-10
Also published as: BRPI0913386A2; MX2010013320A; MA32380B1; FR2932054B1; FR2932054A1; EP2300997A1; BRPI0913386B1

Abstract

La présente invention se rapporte à un système de vidéosurveillance reconfigurable dynamiquement composé d'au moins une caméra vidéo (1), d'un serveur distant (3), d'au moins un terminal de visualisation (6), de moyens permettant d'enregistrer les séquences vidéo capturées (5) par la ou les caméra(s), ledit système étant caractérisé en ce que : la ou les caméra(s) vidéo (1) et le serveur distant (3) comportent des moyens pour communiquer entre eux au travers d'un réseau de télécommunications (2); la ou les caméra(s) vidéo (1) comportent des moyens pour compresser les séquences vidéo capturées, le taux de compression étant adapté dynamiquement en tenant compte des messages de contrôle en provenance du serveur distant (3); la ou les caméra(s) vidéo (1) comportent des moyens pour analyser lesdites séquences vidéo dans le domaine compressé, de caractériser l'activité détectée dans leur champ de vision et de reporter le résultat de cette caractérisation au serveur distant (3); le serveur distant (3) comporte des moyens de calculer pour chacun des flux vidéo compressés en provenance de la ou les caméra(s) vidéo une commande permettant de paramétrer chacune d'elles en tenant compte des données de signalisation reçues.

Description

SYSTEME DE VIDEOSURVEILLANCE INTELLIGENT RECONFIGURABLE

DYNAMIQUEMENT

L'invention concerne un système de vidéosurveillance s'appuyant sur un réseau muni d'au moins une caméra intelligente et capable de se reconfigurer dynamiquement. Dans la description de l'invention, « caméra intelligente » désigne une caméra comportant des moyens permettant de compresser la séquence vidéo capturée. Il peut également s'agir d'une caméra analogique ou numérique couplée à un boîtier de compression. Dans les deux cas, cette « caméra intelligente » est également capable d'effectuer une analyse de ladite séquence dans le domaine compressé. La caméra intelligente est en outre capable de transmettre la séquence vidéo compressée et le résultat de l'analyse dans le domaine compressé à un serveur au travers d'un réseau de télécommunications.

Dans la description, l'expression « premier plan » est utilisée pour désigner le ou les objet(s) mobile(s) d'une séquence vidéo. L'expression « arrière plan » fera quant à elle référence à l'environnement ainsi qu'aux objets fixes ou quasi-fixes de la séquence. Ceci comprend, par exemple, le sol, les arbres ou d'autres objets immobiles ou non parfaitement immobiles.

Par ailleurs, les expressions « séquence vidéo » ou « flux vidéo » désignent un même objet.

Les systèmes de vidéosurveillance ont considérablement évolués ces dernières années. La numérisation des contenus et l'augmentation des capacités de calcul des ordinateurs rendent possible le traitement en temps réel des séquences vidéo afin de les interpréter. De nouveaux systèmes apparaissent depuis quelques années et sont habituellement qualifiés de systèmes de vidéosurveillance intelligents. Ces systèmes s'appuient sur des techniques de traitement d'image et/ou de vidéo permettant par exemple de comparer des images, de détecter un mouvement, de détecter un visage ou de reconnaître un objet.

Un système de vidéo surveillance classique comprend généralement les éléments suivants : - au moins une caméra analogique ou numérique pour capturer une séquence vidéo ;

- au moins un serveur distant capable de traiter les séquences vidéo transmises par la ou les caméras du système ; - au moins un terminal permettant de visionner et/ou stocker les séquences vidéo ;

- au moins une zone mémoire permettant de stocker les séquences vidéo.

Jusqu'à récemment, la ou les caméra(s) vidéo(s) avaient pour tâche principale de capturer et de compresser le flux vidéo numérique avant transmission vers le serveur distant via un réseau de télécommunications. La volonté d'utiliser toujours plus efficacement la bande passante des média de transmissions sur lesquels transitent ces séquences et les objectifs de réduction du coût de leur stockage ont posé très tôt la question de la compression vidéo. Les algorithmes de compression classiques permettent de réduire la redondance spatiale et la redondance temporelle propre à une séquence vidéo. Ces techniques de compression permettent de réduire le débit nécessaire pour la transmission d'un flux vidéo au travers, par exemple, d'un réseau de télécommunications. Dans les systèmes d'encodage vidéo existant, il faut sélectionner un taux de compression adapté à l'application et donc au service considéré. En effet, plus le flux vidéo est compressé et donc le débit réduit, plus la qualité de la vidéo telle que perçue par l'utilisateur du service peut être dégradée. Il est par conséquent important de choisir correctement le débit de transmission de ces flux. Il existe de nombreuses méthodes pour réaliser cette allocation de débit. Les techniques existantes permettent d'adapter le débit des flux vidéo aux contraintes de bande passante des réseaux de télécommunications.

Comme souligné précédemment, l'un des éléments clés constitutif d'un système de vidéosurveillance est le serveur distant. Son rôle est habituellement de réaliser des analyses sur le flux vidéo après décompression. Ces analyses, par exemple l'identification des objets mobiles d'un flux vidéo, sont traditionnellement réalisées au niveau du serveur distant et non pas des caméras car celles-ci requièrent des outils algorithmiques capables d'analyser un flux vidéo non compressé. En effet, le flux vidéo est analysé au niveau des pixels des images, ce qui nécessite des ressources en terme de calculs et mémoire importantes. C'est pour cette raison que l'analyse des flux vidéo n'était jusqu'à récemment pas conduite par les caméras mais à distance sur un serveur possédant suffisamment de ressources pour décompresser les flux et les analyser.

Il est aujourd'hui possible de conduire des analyses de séquence vidéo dans le domaine compressé et donc de réduire les charges calcul et mémoire nécessaires à l'analyse d'un flux vidéo. Cette méthode a pour intérêt d'utiliser une partie du travail effectué par l'encodeur vidéo et ainsi d'exploiter des informations disponibles dans le domaine compressé telles que, par exemple, les coefficients calculés par application de la transformée en cosinus discrète (connu sous la dénomination anglo-saxonne « Discrète Cosine Transform » - DCT) et les vecteurs estimation de mouvement. Ces informations doivent être ensuite analysées. En effet, les vecteurs estimation de mouvement ne correspondent pas nécessairement à un mouvement réel d'un objet dans la séquence vidéo mais peuvent s'apparenter à du bruit. En utilisant cette méthode il est alors possible, par exemple, d'identifier les zones de l'image comportant des objets mobiles. La charge de calcul devenant raisonnable, les caméras vidéo peuvent se charger de l'analyse des flux vidéo. Différentes étapes sont nécessaires pour utiliser ces informations afin d'identifier les objets mobiles. La reprise des travaux décrits dans la proposition de brevet Optical flow estimation method (US2006/0188013 A1 ) a permis de délimiter cinq fonctions identifiées dans l'article Statistical motion vector analysis for tracking in compressée/ video stream de Marc Leny, Françoise Prêteux et Didier Nicholson. Ces modules sont illustrés figure 1 et décrits ci-dessous : le décodage basse résolution (LRD - Low-Res Décoder) permet de reconstruire l'intégralité d'une séquence à la résolution du bloc, supprimant à cette échelle la prédiction de mouvement ; - le générateur de vecteurs estimation de mouvement (MEG -

Motion Estimation Generator) détermine quant à lui des vecteurs pour l'ensemble des blocs que le codeur a codé en mode "Intra" (au sein d'images Intra ou prédites) ; la segmentation basse résolution d'objets (LROS - Low-Res Object Segmentation) s'appuie pour sa part sur une estimation du fond dans le domaine compressé grâce aux séquences reconstruites par le LRD et donne donc une première estimation des objets mobiles ; le filtrage d'objets basé sur le mouvement (OMF - Object Motion Filtering) utilise les vecteurs en sortie du MEG pour déterminer les zones mobiles à partir de l'estimation de mouvement ; une décision coopérative (CD - Coopérative Décision) est établie à partir de ces deux segmentations, prenant en compte les spécificités de chaque module selon le type d'image analysée (Intra ou prédite).

Les résultats de l'analyse dans le domaine compressé permettent l'identification de zones contenant des objets mobiles (figure 2), la génération de cartes de mouvement établies à partir des vecteurs estimation de mouvement (figure 3) et de cartes de confiance correspondant aux contours de l'image basse résolution (figure 4).

L'intérêt principal de l'analyse dans le domaine compressé porte sur les temps de calcul qui sont considérablement réduits par rapport aux outils d'analyse classiques. En s'appuyant sur le travail effectué au moment de la compression vidéo, les temps d'analyse sont aujourd'hui de 10 à 20 fois le temps réel (250 à 500 images traitées par seconde) pour des images 720x576 4:2:0.

Dans un système de vidéosurveillance comportant un nombre significatif de caméras vidéo communicant avec un serveur distant grâce à un réseau de télécommunications, la bande passante disponible propre au dimensionnement du réseau de télécommunications doit être partagée. Une architecture classique de réseau de vidéosurveillance s'appuie sur un dimensionnement réseau initial permettant soit de passer les flux venant de l'ensemble des capteurs ou caméras vidéo simultanément, soit prenant en compte un basculement périodique d'un flux à l'autre. C'est alors au niveau de la salle de surveillance que l'opérateur ou des serveurs de calculs et d'analyse puissants peuvent demander la visualisation d'un flux précis selon l'importance accordée.

Dans ces systèmes classiques, il est fréquent que des flux vidéo ne comportant aucune information pertinente soient transmis des capteurs vers les serveurs de traitement. Dans ce cas, l'utilisation des ressources du réseau de télécommunications utilisé n'est pas optimisée.

L'objet de la présente invention concerne un système de vidéosurveillance intelligent ayant notamment la capacité de se reconfigurer automatiquement afin de pouvoir, par exemple, optimiser l'utilisation des ressources dudit système. Ce système s'appuie sur l'utilisation de caméras intelligentes ayant la capacité de compresser et d'analyser dans le domaine compressé les séquences vidéo qu'elles capturent et d'y détecter des événements spécifiques. Des données de signalisation sont ensuite transmises au travers d'un réseau de télécommunications par les caméras intelligentes à un serveur distant. Ce serveur est capable d'analyser ces données de signalisation afin de déterminer des commandes permettant de reconfigurer les éléments du système de manière dynamique.

Plus précisément l'invention a pour objet un système de vidéosurveillance reconfigurable dynamiquement composé d'au moins une caméra vidéo, d'un serveur distant, d'au moins un terminal de visualisation, de moyens permettant d'enregistrer les séquences vidéo capturées par la ou les caméra(s), ledit système étant caractérisé en ce que : la ou les caméra(s) vidéo et le serveur distant comportent des moyens pour communiquer entre eux au travers d'un réseau de télécommunications ; la ou les caméra(s) vidéo comportent des moyens pour compresser les séquences vidéo capturées, le taux de compression étant adapté dynamiquement en tenant compte des messages de contrôle en provenance du serveur distant ; la ou les caméra(s) vidéo comportent des moyens pour analyser lesdites séquences vidéo dans le domaine compressé, pour caractériser l'activité détectée dans leur champ de vision et pour transmettre le résultat de cette caractérisation au serveur distant; le serveur distant comporte des moyens de calculer pour chacun des flux vidéo compressés en provenance de la ou les caméra(s) vidéo une commande, permettant de paramétrer chacune d'elles en tenant compte des données de signalisation reçues.

Une variante de ce système de vidéosurveillance est caractérisée en ce qu'un niveau de priorité est associé par le serveur à chacun des flux vidéo reçus en provenance de la ou des caméra(s) du système, ledit niveau de priorité étant déterminé en fonction des informations de signalisation représentatives de l'activité détectée et reportées par la ou les caméra(s) vidéo(s).

Une variante de ce système de vidéosurveillance est caractérisée en ce que le serveur distant contrôle la transmission des données de signalisation envoyées par la ou les caméra(s) vidéo(s) du système en envoyant des requêtes permettant d'adapter la fréquence, le type et le contenu des messages de signalisation.

Une variante de ce système de vidéosurveillance est caractérisée en ce que la compression des séquences vidéo capturées par les caméras est paramétrée par une consigne de débit propre à chaque caméra, ladite consigne de débit étant calculée par le serveur distant en fonction du niveau de priorité associé à chacun des flux vidéo et est ensuite transmis par le serveur à chacune des caméras du système. Une variante de ce système de vidéosurveillance est caractérisée en ce qu'un niveau de priorité associé aux flux vidéo est calculé par chaque caméra, ledit ordre de priorité étant déterminé en fonction de l'activité détectée par chacune des caméras.

Une variante de ce système de vidéosurveillance est caractérisée en ce que le niveau de priorité associé aux flux vidéo est transmis au serveur par chacune des caméras du système et que ledit serveur utilise ces informations de signalisation afin de calculer une commande de débit transmise aux caméras afin que celles-ci adaptent leurs paramètres de compression afin de satisfaire à cette contrainte de débit cible. Une variante de ce système de vidéosurveillance est caractérisée en ce que le niveau de priorité du flux vidéo est utilisé par chaque caméra pour calculer une consigne de débit, ladite consigne de débit étant utilisée pour adapter les paramètres de compression du flux vidéo.

Une variante de ce système de vidéosurveillance est caractérisée en ce que le basculement automatique de l'affichage sur le ou les terminaux de visualisation est d'une durée déterminée par l'ordre de priorité, ladite durée étant d'autant plus longue que l'ordre de priorité correspondant est important.

Une variante de ce système de vidéosurveillance est caractérisée en ce que l'affichage sur le ou les terminaux de visualisation d'un flux vidéo prioritaire s'accompagne d'un mécanisme de réalité augmentée permettant de mettre en avant la ou les portion(s) de l'image contenant l'activité inhabituelle identifiée par la caméra intelligente.

Une variante de ce système de vidéosurveillance est caractérisée en ce que le mécanisme de réalité augmentée est contrôlé par le serveur distant et que ledit serveur transmet en conséquence une requête à la caméra intelligente correspondante afin d'acquérir les données de signalisation nécessaires.

Une variante de ce système de vidéosurveillance est caractérisée en ce que la ou les portion(s) de l'image contenant l'activité inhabituelle sont mis en avant par un ou plusieurs rectangle(s) clignotant(s) ou fixe(s).

Une variante de ce système de vidéosurveillance est caractérisée en ce que la ou les portion(s) de l'image contenant l'activité inhabituelle sont mis en avant par un surlignage de couleur. Une variante de ce système de vidéosurveillance est caractérisée en ce que la mise en avant de la portion de l'image contenant l'activité inhabituelle identifiée par la caméra intelligente est accompagnée d'un message s'affichant sur l'écran d'au moins un terminal de visualisation.

Une variante de ce système de vidéosurveillance est caractérisée en ce que la mise en avant de la portion de l'image contenant l'activité inhabituelle identifiée par la caméra intelligente est accompagnée d'un témoin d'alarme.

Une variante de ce système de vidéosurveillance est caractérisée en ce que les flux vidéo compressés sont enregistrés dans une zone mémoire du système et que les données de contrôle, telles que le niveau de priorité des flux et les métadonnées en provenance des caméras ciblées, sont également enregistrées.

Une variante de ce système de vidéosurveillance est caractérisée en ce qu'un mode supervisé du système permet à un opérateur de sélectionner un flux vidéo particulier non nécessairement prioritaire et que le serveur réagit en conséquent en diminuant le débit global et en ordonnant à la caméra choisie un débit maximal.

L'invention sera mieux comprise et d'autres avantages apparaîtront à la lecture de la description qui va suivre donnée à titre non limitatif et grâce aux figures annexées parmi lesquelles :

la figure 1 présente les modules utilisés pour l'analyse dans le domaine compressé tels que décrits précédemment ; - la figure 2 illustre un résultat possible de l'analyse dans le domaine compressé, à savoir l'identification de zones contenant des objets mobiles ; la figure 3 montre un autre exemple de résultat de l'analyse dans le domaine compressé, à savoir une carte de mouvement établie à partir des vecteurs estimation de mouvement ; la figure 4 montre un autre exemple de résultat de l'analyse dans le domaine compressé, à savoir une carte de confiance basse résolution correspondant aux contours de l'image; - la figure 5 illustre une variante de l'architecture du système de vidéosurveillance selon l'invention; la figure 6 illustre un exemple de séquencement des opérations réalisées par une caméra intelligente du système de vidéosurveillance selon l'invention ; - la figure 7 illustre un exemple de séquencement des opérations réalisées par le serveur distant du système de vidéosurveillance selon l'invention ;

Le système de vidéosurveillance selon l'invention s'appuie sur une architecture dont un exemple est donné figure 5. Les zones à surveiller sont couvertes à l'aide d'au moins une caméra vidéo 1 dite(s) caméra(s) intelligente(s). Ces caméras intelligentes sont capables au moins : de capturer une séquence vidéo de la zone qu'elles couvrent ; de compresser la séquence vidéo (en utilisant par exemple les techniques de compression décrites dans les normes MPEG-2 et MPEG-4) ; d'analyser les séquences vidéo dans le domaine compressé ; - de caractériser l'activité détectée dans la zone couverte par la caméra.

L'analyse dans le domaine compressé permet à ces caméras intelligentes de caractériser des activités pertinentes au sens du service rendu par le système. L'intérêt d'effectuer ces opérations dans le domaine compressé est de réduire les temps de calcul et les ressources mémoires nécessaires à l'analyse et donc de rendre possible l'implantation de ces outils d'analyse embarquée au sein des caméras. Il peut être réalisé à faible coût, par exemple, une segmentation des objets mobiles et un suivi de ces objets sur les flux vidéo. Il est ensuite possible d'intégrer dans chaque caméra des outils de modélisation et de caractérisation de l'activité en utilisant, par exemple, des techniques de modélisation par mélanges de Gaussiennes (GMM - Gaussians Mixture Models) prenant en compte les données issues des objets suivis (points d'entrée et de sortie du champ de vision, trajectoire, vitesse, accélération, taille, etc). Une phase d'apprentissage non supervisée est dans ce cas nécessaire au niveau de chaque caméra, à laquelle peut s'ajouter une ou plusieurs étape(s) supervisée(s) pour préciser le type de comportement anormal à remonter en priorité au serveur distant 3 (identification d'une portion de séquence par un opérateur, reconstitution par scènes actées, etc.). Les activités pertinentes pouvant être détectées par les caméras intelligentes sont, par exemple : une voiture circulant à contre sens (dans le cadre d'un service de surveillance du trafic routier) ; un mouvement de foule, pouvant être la conséquence d'un événement critique tel qu'un incendie ; un individu ayant un comportant suspect dans un parking ; un départ étoile depuis un point pouvant être déclenché par tout événement dit inhabituel par rapport à un fonctionnement donné ; Ces caméras communiquent à un serveur distant 3 les flux vidéo et les données de signalisation représentatives de l'activité éventuelle détectée et ceci au travers d'un premier réseau de télécommunications 2. Ces données de signalisation peuvent être, par exemple : - le nombre d'objets mobiles détectés ; la surface couverte par les objets mobiles ; la vitesse de déplacement des objets mobiles ; l'emplacement des objets mobiles ; etc. Ce réseau de télécommunications peut être, par exemple, un réseau de fibres optiques ou bien un réseau sans fil utilisant le protocole internet (connu sous la dénomination anglo-saxonne d'« internet protocol » - IP).

Le serveur distant 3 a pour rôle de router les flux vidéo qu'il reçoit en provenance des caméras intelligentes vers un ou plusieurs serveurs de stockage 5, un ou plusieurs terminaux de contrôle 6 permettant à un ou plusieurs opérateurs de surveiller les zones concernées, et ceci au travers d'un deuxième réseau de télécommunications 4. Le serveur distant 3 est en outre capable de déclencher des signaux d'alarme 7 à distance. Le serveur permet également de traiter les données de signalisation reportées par les caméras intelligentes. Celui-ci peut par exemple classer les flux vidéo reçus par ordre de priorité et utiliser des informations pour reconfigurer dynamiquement le système de vidéosurveillance.

Le serveur distant 3 peut gérer par ailleurs plusieurs tâches liées au(x) poste(s) de surveillance 6 : - Le basculement automatique d'un flux vidéo à l'autre sur le moniteur avec un affichage d'une durée déterminée selon l'ordre de priorité. Si plusieurs flux sont considérés comme hautement prioritaires (par seuillage sur la priorité, par exemple), le serveur pourra afficher une mosaïque de ces flux en continuant le basculement sur les autres flux dans l'une des fenêtres.

L'affichage d'un flux prioritaire peut s'accompagner d'un aspect de réalité augmentée en mettant en avant la portion de l'image contenant l'activité inhabituelle identifiée par la caméra. Le type de technique utilisée pourra être par exemple : l'utilisation de rectangle clignotant, le surlignage de couleur, etc. Ceci peut s'accompagner d'un message à l'écran et/ou d'un témoin d'alarme. Le tout est fait via une requête du serveur 3 pour obtenir les données de signalisation correspondantes de la caméra concernée.

L'enregistrement des flux dans une zone mémoire 5 du réseau avec leurs niveaux de priorités, éventuellement accompagné de données de signalisation provenant des caméras ciblées, par exemple dans le cas de priorités élevées.

La prise en compte d'un mode supervisé : l'opérateur peut sélectionner un flux particulier non nécessairement prioritaire selon la caméra. Le serveur diminue alors le débit global (priorité totale P plus grande) et ordonne à la caméra choisie un débit maximal.

Etc.

Une variante permettant de réduire le débit de transmission des informations de signalisation circulant des caméras vers le serveur est de ne remonter qu'un unique indicateur de priorité par caméra. En effet, l'ensemble des données de signalisation disponibles en sortie d'une des caméras 1 peut (si le nombre de données de signalisation est élevé) représenter un volume d'information non négligeable et il n'est pas toujours nécessaire de les transmettre de façon permanente sur le réseau. Dans une autre variante de l'invention, les caméras vidéo 1 transmettent au serveur distant 3 un ensemble d'informations de signalisation (également qualifiées de métadonnées). Dans ce cas, il est de la responsabilité du serveur d'associer une priorité à chacun des flux en se basant sur ces informations pour ensuite déterminer les commandes permettant de reconfigurer dynamiquement le système. Le serveur distant peut envoyer une requête extérieure afin de commander la transmission de toute ou d'une partie des données de signalisation. Si l'activité détectée est conforme au modèle établi par apprentissage et donc que le maximum de vraisemblance normalisé est proche de 1 , la priorité sera nulle ou très faible. Plus elle s'éloigne du modèle, plus l'ordre de priorité est élevé. Une priorité chiffrée entre 0 et 1 est ainsi obtenue par 1-MLE(X, θ) où X correspond au modèle de gaussienne appris, <9 au vecteur de paramètres courant et MLE à la fonction maximum de vraisemblance normée (MLE faisant référence au terme anglo-saxon Maximum Likelihood Estimation). Les deux alternatives présentées précédemment sont réalisables dans le cadre de l'invention (priorités des flux déterminée par chacune des caméras du système ou par le serveur distant), mais afin d'illustrer les opérations exécutées par chacun des éléments avec l'aide des figures 6 et 7, l'exemple du calcul de priorités au niveau du serveur distant est utilisé dans la suite de la description.

La figure 6 donne un exemple des opérations pouvant être exécutées par une des caméras intelligentes du système. Le flux vidéo 10 capturé par la caméra 1 (figure 5) est compressé et analysé dans le domaine compressé

1 1 . La compression est réalisée en suivant une consigne de débit cible 15. L'étape d'encodage, d'analyse et de caractérisation de l'activité aboutit à : un flux vidéo compressé 12 ; un ensemble de données de signalisation (ou métadonnées) 13 résultant par exemple de l'application des outils de caractérisation du flux compressé. L'étape de compression est en outre paramétrée par une consigne de débit émanent du serveur distant 3 et optimisée par l'analyse dans le domaine compressé. En effet, l'analyse dans le domaine compressée peut permettre de réaliser une segmentation des images en différentes zones de pertinence. Pour chacune de ces différentes zones, des débits différents peuvent alors être alloués pour adapter le débit du flux vidéo à la valeur cible.

Si l'on considère, par exemple, que la partie la plus pertinente des images du flux est le premier plan, le procédé pourra mener l'allocation d'un débit important pour cette partie au dépend de la partie non pertinente du flux, dans ce cas l'arrière plan, qui se verra allouer un débit plus faible.

Il est également possible de renforcer de manière intelligente la protection face aux erreurs de transmission en utilisant les résultats de l'analyse dans le domaine compressé. Le nombre de bits de redondance peut ainsi être augmenté pour les parties significatives des images portées par le flux vidéo considéré. Enfin, la partie pertinente d'un même flux (le premier plan par exemple), peut être chiffrée par exemple dans des soucis de respect de la vie privée, cela aussi grâce aux résultats de l'analyse dans le domaine compressé. La figure 7 donne un exemple des opérations pouvant être exécutées par le serveur distant. L'exemple donné considère un système où trois caméras intelligentes transmettent chacune au serveur distant un ensemble de données 21 , 24 et 27. Ces ensembles de données sont constitués, par exemple, des flux vidéo 22, 25, 28 et des données de signalisation associées 23, 26, 29 pour chacune des caméras. Ces données sont ensuite traitées par le serveur afin d'effectuer un arbitrage de priorités 30 entre les flux. En d'autres termes, le serveur associe un niveau de priorité 31 , 32, 33 à chaque flux vidéo en fonction des informations portées par les données de signalisation. Le serveur utilise ensuite ces différents niveaux de priorités ainsi que des informations propres à la topologie et aux caractéristiques du système 35 pour déterminer 34 les commandes de reconfiguration 36, 37, 38 à destination des chacune des caméras du système. Ces commandes sont, par exemple, des consignes de débits qui seront utilisées pour adapter les paramètres de compression du flux vidéo par chaque caméra.

Les commandes ainsi calculées devront ensuite être transmises 39, 40, 41 à travers le réseau de télécommunications aux caméras concernées.

Comme expliqué précédemment, les commandes calculées par le serveur peuvent consister en une valeur de débit cible. Si chaque caméra i est capable d'envoyer un flux vidéo compressé à un débit spécifié et que le serveur est chargé de gérer N caméras (dans l'exemple de la figure 7, N = 3) sur un réseau ayant une contrainte de débit maximum D, la prise en compte de l'ordre de priorité Pj sur le débit Dj par caméra peut se faire par exemple selon la formule :

II est important de noter que si dans l'exemple des figures 6 et 7, le calcul du niveau de priorité des flux est effectué par le serveur distant, il est également possible, comme décrit précédemment, d'effectuer ce calcul au niveau des caméras intelligentes. II est également possible que chacune des caméras calcule son débit

Dj. Dans ce cas et considérant que le débit total D n'évolue pas et est transmis une fois pour toute à tous les éléments du réseau, le serveur retournera, lorsque le réseau doit être configuré, une unique valeur à l'ensemble des caméras :

N

Les caméras peuvent ensuite calculer leur débit cible selon la formule précédente et adapter la compression du flux vidéo à cette valeur.

Claims

REVENDICATIONS - Système de vidéosurveillance reconfigurable dynamiquement composé d'au moins une caméra vidéo (1 ), d'un serveur distant (3), d'au moins un terminal de visualisation (6), de moyens permettant d'enregistrer les séquences vidéo capturées (5) par la ou les caméra(s), ledit système étant caractérisé en ce que : la ou les caméra(s) vidéo (1 ) et le serveur distant (3) comportent des moyens pour communiquer entre eux au travers d'un réseau de télécommunications (2) ; la ou les caméra(s) vidéo (1 ) comportent des moyens pour compresser les séquences vidéo capturées, le taux de compression étant adapté dynamiquement en tenant compte des messages de contrôle en provenance du serveur distant (3) ; la ou les caméra(s) vidéo (1 ) comportent des moyens pour analyser lesdites séquences vidéo dans le domaine compressé, de caractériser l'activité détectée dans leur champ de vision et de transmettre le résultat de cette caractérisation au serveur distant (3) ; le serveur distant (3) comporte des moyens de calculer pour chacun des flux vidéo compressés en provenance de la ou les caméra(s) vidéo une commande permettant de paramétrer chacune d'elles en tenant compte des données de signalisation reçues. - Système de vidéosurveillance selon la revendication 1 caractérisé en ce qu'un niveau de priorité est associé par le serveur à chacun des flux vidéo reçus en provenance de la ou des caméra(s) du système, ledit niveau de priorité étant déterminé en fonction des informations de signalisation représentatives de l'activité détectée et reportées par la ou les caméra(s) vidéo(s). 3- Système de vidéosurveillance selon l'une des revendications 1 ou 2 caractérisé en ce que le serveur distant contrôle la transmission des données de signalisation envoyées par la ou les caméra(s) vidéo(s) du système en envoyant des requêtes permettant d'adapter la fréquence, le type et le contenu des messages de signalisation.

4- Système de vidéosurveillance selon l'une des revendications 1 à 3 caractérisé en ce que la compression des séquences vidéo capturées par les caméras est paramétrée par une consigne de débit propre à chaque caméra, ladite consigne de débit étant calculée par le serveur distant en fonction du niveau de priorité associé à chacun des flux vidéo et étant ensuite transmise par le serveur à chacune des caméras du système.

5- Système de vidéosurveillance selon la revendication 1 caractérisé en ce qu'un niveau de priorité associé aux flux vidéo est calculé par chaque caméra, ledit ordre de priorité étant déterminé en fonction de l'activité détectée par chacune des caméras.

6- Système de vidéosurveillance selon l'une des revendications 1 ou 5 caractérisé en ce que le niveau de priorité associé aux flux vidéo est transmis au serveur par chacune des caméras du système et que ledit serveur utilise ces informations de signalisation afin de calculer une commande de débit transmise aux caméras afin que celles-ci adaptent leurs paramètres de compression afin de satisfaire à cette contrainte de débit cible.

7- Système de vidéosurveillance selon l'une des revendications 1 ou 5 caractérisé en ce le niveau de priorité du flux vidéo est utilisé par chaque caméra pour calculer une consigne de débit, ladite consigne de débit étant utilisée pour adapter les paramètres de compression du flux vidéo. - Système de vidéosurveillance selon l'une des revendications précédentes caractérisé en ce que le basculement automatique de l'affichage sur le ou les terminaux de visualisation est d'une durée déterminée par l'ordre de priorité. - Système de vidéosurveillance selon l'une des revendications précédentes caractérisé en ce que l'affichage sur le ou les terminaux de visualisation d'un flux vidéo prioritaire s'accompagne d'un mécanisme de réalité augmentée permettant de mettre en avant la ou les portion(s) de l'image contenant l'activité inhabituelle identifiée par la caméra intelligente. 0-Système de vidéosurveillance selon la revendication 9 caractérisé en ce que le mécanisme de réalité augmentée est contrôlé par le serveur distant et que ledit serveur transmet en conséquence une requête à la caméra intelligente correspondante afin d'acquérir les données de signalisation nécessaires. 1 -Système de vidéosurveillance selon l'une des revendications 9 à 10 caractérisé en ce que la ou les portion(s) de l'image contenant l'activité inhabituelle sont mis en avant par un ou plusieurs rectangle(s) clignotant(s) ou fixe(s). 2-Système de vidéosurveillance selon l'une des revendications 9 à 1 1 caractérisé en ce que la ou les portion(s) de l'image contenant l'activité inhabituelle sont mis en avant par un surlignage de couleur. 3-Système de vidéosurveillance selon l'une des revendications 9 à 12 caractérisé en ce que la mise en avant de la portion de l'image contenant l'activité inhabituelle identifiée par la caméra intelligente est accompagnée d'un message s'affichant sur l'écran d'au moins un terminal de visualisation. -Système de vidéosurveillance selon l'une des revendications 9 à 13 caractérisé en ce que la mise en avant de la portion de l'image contenant l'activité inhabituelle identifiée par la caméra intelligente est accompagnée d'un témoin d'alarme. -Système de vidéosurveillance selon l'une des revendications précédentes caractérisé en ce que les flux vidéo compressés sont enregistrés dans une zone mémoire du système et que les données de contrôle, telles que le niveau de priorité des flux et les métadonnées en provenance des caméras ciblées, sont également enregistrées. -Système de vidéosurveillance selon l'une des revendications précédentes caractérisé en ce qu'un mode supervisé du système permet à un opérateur de sélectionner un flux vidéo particulier non nécessairement prioritaire et que le serveur réagit en conséquent en diminuant le débit global et en ordonnant à la caméra choisie un débit maximal.