WO2021123563A1

WO2021123563A1 - Analyse d'un contenu multimedia

Info

Publication number: WO2021123563A1
Application number: PCT/FR2020/052333
Authority: WO
Inventors: Laurent Jean Brunel; Louis-Xavier Carbonnel
Original assignee: Orange
Priority date: 2019-12-20
Filing date: 2020-12-08
Publication date: 2021-06-24
Also published as: FR3105689A1

Abstract

L'invention concerne un procédé d'analyse d'un contenu multimédia et un procédé d'apprentissage associé. Le procédé d'analyse est caractérisé en ce qu'il comporte, sur un dispositif d'analyse (DAN), les étapes suivantes : - obtenir (E30) des premiers événements audio et/ou vidéo (EVS') relatifs à des premiers contenus multimédia; - lors de l'obtention d'un second contenu multimédia (C), déclencher en temps réel une action portant sur une mise à disposition dudit second contenu multimédia en fonction d'une présence, dans au moins une portion dudit second contenu multimédia (C), d'un au moins (EV) desdits premiers évènements audio et/ou vidéo (EVS'). L'invention concerne également des procédés d'apprentissage et les dispositifs, système, produits programme d'ordinateur et supports correspondants

Description

DESCRIPTION

TITRE : Analyse d'un contenu multimédia

Domaine de l'invention

L'invention se rapporte de manière générale aux télécommunications, et plus précisément à l'accès aux contenus audiovisuels. Elle s'applique plus particulièrement à des terminaux utilisateurs et/ou à des plateformes, manipulant de tels contenus.

Art Antérieur

Il existe aujourd'hui des méthodes pour déclencher une action sur un contenu audiovisuel, par exemple un enregistrement ou un changement de visualisation du contenu (zapping). Cependant ces actions sont généralement déclenchées sur la base d'informations insérées dans le flux vidéo (aussi appelées métadonnées). Par exemple il est possible de changer de chitine diffusée lorsqu'on atteint l'heure de diffusion théorique d'un programme, sur la base de telles métadonnées.

Ceci suppose cependant que ces informations soient insérées à l'avance dans le flux vidéo, ce qui est fastidieux et parfois peu efficace.

De surcroît si un contenu est capturé et diffusé en temps réel (par exemple une chaîne de télévision en direct), il n'est pas possible de lancer des actions liées à son contenu, qui n'est pas forcément connu à l'avance.

Le brevet US déposé sous le numéro 12/059,618 décrit un système de notification d'événements personnalisés à l'aide d'une analyse vidéo en temps réel. Dans un mode de réalisation, un flux vidéo en direct est automatiquement surveillé et les caractéristiques du flux vidéo sont analysées par rapport à des critères qui se rapportent à un événement identifié au préalable par un utilisateur. Les critères ont trait aux caractéristiques de l'image ou de l'audio dans le flux vidéo. Si les critères sont remplis, l'utilisateur est informé que l'événement s'est produit et cette notification peut être effectuée par le biais de messages sur l'écran d'affichage vidéo (par exemple sur l'écran de télévision) ou d'autres techniques de messagerie (par exemple, SMS ou courrier électronique). Dans un exemple, les critères peuvent définir un logo particulier et l'utilisateur est averti si l'analyse détecte le logo dans le flux vidéo.

Cependant l'événement défini par cette méthode reste limité à la reconnaissance d'un modèle (en anglais, « pattern ») contenu dans le flux audio ou vidéo. Elle se fonde sur la détection d'éléments caractéristiques prédéfinis dans la vidéo. De ce fait, cette approche ne peut estimer des événements plus complexes, comme par exemple le niveau de violence dans certains contenus. De plus, elle est souvent mise en défaut car ne pouvant prendre en compte les variations qui peuvent accompagner l'événement De surcroît cette méthode est très complexe à mettre en œuvre pour plusieurs contenus et plusieurs événements.

Exposé de l'invention L'invention vient améliorer l'état de la technique. Elle propose à cet effet un procédé d'analyse d'un contenu multimédia.

Dans au moins un mode de réalisation, le procédé comporte les étapes suivantes :

- obtenir (E30) des premiers événements audio et/ou vidéo (EVS') (dits évènements préférés) relatifs à des premiers contenus multimédia ;

- lors de l'obtention d'un second contenu multimédia (C), déclencher en temps réel une action portant sur une mise à disposition dudit second contenu multimédia en fonction d'une présence, dans au moins une portion dudit second contenu multimédia (C), d'un au moins (EV) desdits premiers évènements audio et/ou vidéo (EVS').

Dans au moins un mode de réalisation, le procédé est mis en œuvre sur un dispositif d'analyse (DAN).

Par « contenu multimédia », on entend un contenu numérique qui contient au moins une image, un texte ou une donnée sonore. Le contenu multimédia peut être reçu en diffusion (streaming, chitine de télévision, de radio, etc.) ou stocké sur un support (disque dur, base de données, serveur, etc.).

Par « événement», on entend une caractéristique ou un ensemble de caractéristiques liées à l'un au moins des médias constituant le contenu; en liaison avec les exemples précédents, il peut s'agir d'une chanson, d'un acteur, d'un niveau de violence, d'un visage, d'un score dans une rencontre sportive ou dans le déroulement d'un jeu, etc. Un évènement peut être défini via une interface utilisateur par exemple, ou automatiquement, par un apprentissage des usages d'au moins un utilisateur notamment.

Dans au moins un mode de réalisation, détecter ladite présence comprend générer (E31) une estimation de ladite présence desdits premiers évènements, dans ladite portion dudit second contenu multimédia (C), par un premier modèle d'analyse de contenus audio et/ou vidéo.

Dans au moins un mode de réalisation, au moins un desdits premier évènements est obtenu depuis une interface utilisateur couplée audit dispositif.

Dans au moins un mode de réalisation, au moins un desdits premier évènements est obtenu en fonction d'un historique de consommation de contenus.

Dans au moins un mode de réalisation, au moins un desdits premier évènements est obtenu en utilisant un second modèle d'analyse dudit historique consommation de contenus.

Dans au moins un mode de réalisation, le premier modèle d'analyse est celui d'un premier réseau de neurones (RN) et comporte des coefficients du réseau de neurones optimisés par une mise en œuvre sur lesdits premiers contenus , et le procédé comporte en outre une étape de :

- mettre en œuvre le premier réseau de neurones sur le second contenu multimédia(C), avec les coefficients optimisés.

Dans au moins un mode de réalisation, le second modèle d'analyse peut être piloté par un second réseau de neurones, pour analyser les préférences de l'utilisateur (par exemple à partir de son historique de consommation) et obtenir ainsi des « premiers » évènements (ou évènements préférés).

Dans au moins un mode de réalisation, déclencher au moins une action portant sur la mise à disposition dudit second contenu multimédia comprend un début ou une fin de restitution dudit second contenu.

Dans au moins un mode de réalisation, déclencher au moins une action portant sur la mise à disposition dudit premier contenu multimédia comprend une notification de la présence dudit premier contenu sur une interface utilisateur.

Dans au moins un mode de réalisation, le procédé comporte, sur un dispositif d'analyse, les étapes suivantes :

- obtenir une liste d'événements préférés relatifs à des contenus multimédia ;

- obtenir un modèle d'analyse de contenus multimédia ;

- analyser un contenu multimédia en temps réel en utilisant le modèle d'analyse ;

- générer une estimation de la présence, dans le contenu multimédia, d'un événement au moins de la liste d'évènements préférés.

Un évènement préféré d'un utilisateur peut être obtenu par exemple par une analyse de ses préférences

Avantageusement selon l'invention, la connaissance préalable d'un contenu multimédia n'est pas nécessaire pour déclencher l'estimation de la présence d'un événement dans ce contenu. L'estimation de la présence de l'événement dépend notamment d'une analyse en temps réel des images et des sons qui composent le contenu et non plus seulement d'informations de description du contenu déterminées à l'avance, ni d'un motif prédéterminé à analyser dans la séquence.

Par « analyse », on entend un procédé s'appliquant au contenu multimédia pour en déduire une présence d'un événement au moins. L'analyse peut fournir en sortie, en liaison avec les exemples précédents, une estimation de la présence de la chanson, de l'acteur, du score, un niveau de violence d'un certain seuil, etc. Cette estimation peut être accompagnée par exemple d'une probabilité, ou d'un indice de fiabilité.

Par analyse « en temps réel » on entend une analyse du contenu multimédia en association avec une base de temps (temps de réception pour un contenu diffu sé, temps de lecture pour un contenu stocké).

Selon un au moins mode de réalisation de l'invention, un procédé tel que décrit ci-dessus inclut en outre les étapes de :

- obtenir au moins un événement préféré d'un utilisateur au moins, relatif à un contenu multimédia ;

- mettre à disposition le contenu multimédia en fonction du résultat de l'estimation de la présence de l'événement préféré. Par « mise à disposition » on entend au moins une action qui peut permettre d'informer un utilisateur de la disponibilité du contenu multimédia : message de notification (incluant par exemple une proposition d'accès ou de basculement (« zapping ») vers le contenu multimédia disponible), enregistrement (sur un support qui est accessible à l'utilisateur), acheminement du contenu, basculement de contenu ou de chaîne, etc. Ainsi par exemple, un utilisateur pourra visualiser automatiquement un concert quand sa chanson préférée est diffusée sur une chaîne, ou disponible en streaming, ou enregistrée dans le réseau local ; être automatiquement notifié d'un film dans lequel joue son acteur préféré ; être informé du niveau de violence dans un film, etc. Dans au moins certains de ses modes de réalisations, cette invention peut donc permettre à l'opérateur qui gère les contenus d'un utilisateur et aux personnes qui consomment le flux vidéo de ne pas être dépendants des métadonnées fournies par les chaînes de télévision pour rendre ce type de service. Il suffit par exemple que l'utilisateur informe son terminal ou cet opérateur du ou des critères qui l'intéressent pour que le contenu multimédia soit mis à disposition de l'utilisateur (ou de son terminal) par le terminal et/ou l'opérateur.

Il peut s'agir d'une mise à disposition sur un terminal utilisateur, lorsque le procédé est mis en œuvre sur le terminal de l'utilisateur, ou d'une mise à disposition pour un terminal utilisateur lorsque le procédé est mis en œuvre sur un autre dispositif que le terminal utilisateur.

Lorsqu'une mise à disposition comprend une notification de la disponibilité d'un contenu, la mise à disposition peut comprendre par exemple une proposition d'accès au contenu et /ou une proposition du choix d'un terminal sur lequel sera effectué l'accès. Ainsi, une notification sur un terminal mobile d'un utilisateur peut proposer à un utilisateur un choix entre un accès au contenu sur un téléviseur ou sur son terminal mobile. Un tel mode de réalisation peut trouver des cas d'application dans le « multitâches ». Notamment, un utilisateur pourrait ainsi continuer à regarder un programme familial sur son téléviseur, tout en regardant les séquences de but de son équipe de football préférée sur son terminal mobile.

Selon au moins un mode de réalisation de l'invention, qui pourra être mis en œuvre alternativement ou cumulativement avec le précédent, dans un procédé tel que décrit ci-dessus, le modèle d'analyse est celui d'un réseau de neurones et comporte les coefficients optimisés du réseau de neurones, et l'analyse comporte en outre une étape de :

- mettre en œuvre le réseau de neurones sur le contenu multimédia, avec les coefficients optimisés.

Avantageusement selon ce mode, un réseau de neurones est utilisé pour réaliser l'analyse du contenu. De tels réseaux sont connus pour leur capacité à traiter des problèmes divers et variés. Ils permettent par ailleurs de traiter des problèmes non structurés, c'est-à-dire des problèmes sur lesquels on ne dispose d'aucune information au préalable. Le réseau de neurones peut par exemple détecter avec un certain indice de fiabilité un niveau de violence dans le contenu qui lui est soumis.

Selon au moins un mode de réalisation, la mise à disposition consiste à donner accès au contenu multimédia à un terminal au moins de l'utilisateur. Avantageusement selon cette variante, si l'étape d'analyse conclut à la présence dans le contenu analysé de l'événement que l'utilisateur a signifié comme l'un de ses préférés, le contenu est rendu disponible pour l'utilisateur, notamment pour un visionnage ou un enregistrement. Le contenu pourra par exemple être acheminé (en streaming, téléchargement, diffusion, etc.) vers la passerelle domestique de l'utilisateur, pour être délivré sur son écran TV, ou enregistré sur un disque dur du réseau local, etc.

Selon au moins un mode de réalisation, qui pourra être mis en œuvre alternativement ou cumulativement avec le précédent, la mise à disposition consiste à notifier la présence du contenu, sur au moins un terminal de l'utilisateur.

Avantageusement selon cette variante, si l'étape d'analyse conclut à la présence dans le contenu analysé de l'événement que l'utilisateur a signifié comme l'un de ses préférés, une notification est transmise à l'utilisateur (par exemple via la passerelle domestique pour affichage sur l'un de ses terminaux) afin qu'il puisse réagir en conséquence (télécharger le contenu, changer de chaîne, etc.)

Selon une autre caractéristique fonctionnelle, l'invention propose aussi un procédé d'apprentissage de caractéristiques de contenus multimédia.

Selon au moins un mode de réalisation, le procédé d'apprentissage comporte, par exemple sur un dispositif d'apprentissage (DAP) les étapes de :

- acquérir (E1) une pluralité de premiers contenus multimédia (C0...CN) ;

- associer (E2) au moins un premier événement (EV) à au moins un desdits premiers contenus acquis

(C);

- obtenir un premier modèle d'analyse (MA) par apprentissage à partir desdits premiers évènements et premiers contenus associés (EV, C).

Selon au moins un mode de réalisation, au moins un desdits premiers évènements est fonction d'un historique de consommation de contenus.

Selon au moins un mode de réalisation, le procédé d'apprentissage utilise un réseau de neurones (RN) et l'étape d'obtenir un premier modèle d'analyse comprend un entraînement du réseau de neurones (RN) par les étapes suivantes :

- recevoir itérativement en entrée desdits premiers contenus et premiers évènements associés (EV,

C). (C, EV) ;

- optimiser les coefficients du réseau de neurones (RN) à partir desdits premiers contenus et premiers évènements associés;

- construire ledit premier modèle d'analyse (MA) à partir des coefficients optimisés.

Selon au moins un mode de réalisation, le procédé d'apprentissage prend en compte dans son optimisation un critère de complexité.

Selon au moins un mode de réalisation le procédé d'apprentissage comporte, sur un dispositif d'apprentissage les étapes de : - acquérir une pluralité de contenus multimédia ;

- associer au moins un événement à au moins un contenu acquis pour constituer au moins un couple de données d'apprentissage ;

- générer un modèle d'analyse à partir des couples de données d'apprentissage.

Avantageusement, l'invention offre une méthode d'apprentissage sur plusieurs contenus multimédia susceptibles de contenir des événements d'intérêt pour des utilisateurs. Cet apprentissage peut être réalisé par exemple par un moteur d'intelligence artificielle (IA) utilisant un apprentissage supervisé. Cet apprentissage a pour but de dégager un certain nombre de caractéristiques de déclenchement, ou événements, de l'ensemble des vidéos. Une fois les contenus et les événements associés entrés dans le dispositif d'apprentissage, celui-ci génère un modèle d'analyse. Le modèle d'analyse comprend tous les éléments nécessaires pour une analyse ultérieure d'un contenu multimédia.

Selon un mode de mise en œuvre particulier de l'invention, le procédé d'apprentissage utilise un réseau de neurones et l' étape de générer un modèle d'analyse consiste à entraîner le réseau de neurones par les sous-étapes suivantes :

- recevoir itérativement en entrée un couple de données d'apprentissage ;

- optimiser les coefficients du réseau de neurones ;

- construire le modèle d'analyse à partir des coefficients optimisés.

Avantageusement selon ce mode, c'est un réseau de neurones qui est utilisé pour réaliser l'apprentissage. De tels réseaux sont connus pour leur capacité à traiter des problèmes divers et variés. Ils permettent par ailleurs de traiter des problèmes non structurés, c'est-à-dire des problèmes sur lesquels on ne dispose d'aucune information au préalable. Le modèle d'analyse issu du réseau de neurones comprend notamment les coefficients optimisés du réseau de neurones, qui vont pouvoir être fournis très simplement à un dispositif d'analyse.

Selon une variante de ce mode de réalisation, le procédé d'apprentissage prend en compte dans son optimisation un critère de complexité.

Avantageusement selon cette variante, le modèle d'analyse peut être adapté, pendant l'apprentissage, au dispositif d'analyse dans lequel il va être mis en œuvre. Si ce dernier dispose d'une puissance de calcul limité, on peut notamment envisager de réaliser un modèle peu complexe, afin qu'il puisse être mis en œuvre sur le dispositif.

Selon une autre caractéristique fonctionnelle, l'invention propose aussi un procédé d'apprentissage de préférences d'au moins un utilisateur, comprenant des étapes de : acquérir au moins une action en lien avoir un contenu multimédia effectuée lors d'une consommation dudit contenu ; association de ladite action à au moins une portion dudit contenu en cours de consommation ; enregistrement de ladite action et de ladite portion associées en liaison avec ledit utilisateur (par exemple en liaison avec un identifiant dudit utilisateur).

L'invention concerne également un dispositif d'analyse d'un contenu multimédia comprenant une mémoire (M'), un processeur (PROC') et un module pour acquérir un contenu multimédia (COM2) configurés pour mettre en œuvre le procédé d'analyse décrit précédemment dans l'un quelconque de ses modes de réalisation.

Selon au moins un mode de réalisation, ladite mémoire (M'), ledit processeur (PROC') et ledit module pour acquérir un contenu multimédia (COM2), sont configurés pour :

- obtenir (E30) des premiers événements audio and/or vidéo (EVS') relatifs à des premiers contenus multimédia ;

Selon au moins un mode de réalisation, le dispositif d'analyse comprend une mémoire, un processeur, un module d'intelligence artificielle, un module pour acquérir un contenu multimédia, configurés pour :

- obtenir un modèle d'analyse de contenus multimédia ;

L'invention concerne également un dispositif d'apprentissage de caractéristiques de contenus multimédia pour mettre en œuvre l'un ou l'autre des procédés d'apprentissage décrit précédemment dans l'un quelconque leurs modes de réalisation.

L'invention concerne ainsi un dispositif d'apprentissage de caractéristiques de contenus multimédia comprenant une mémoire, un processeur, un module pour acquérir un contenu multimédia, un module pour générer un modèle d'apprentissage.

Selon au moins un mode de réalisation, ledit dispositif comprend en outre un module d'intelligence artificielle

Selon au moins un mode de réalisation, ladite mémoire, ledit processeur, et ledit module pour acquérir un contenu multimédia, un module pour générer un modèle d' apprentissage configurés pour: Selon au moins un mode de réalisation, ladite mémoire, ledit processeur, et ledit module pour acquérir un contenu multimédia, un module pour générer un modèle d' apprentissage configurés pour:

- acquérir (E1) une pluralité de premiers contenus multimédia (C0...CN);

- associer (E2) au moins un premier événement (EV) à au moins un desdits premiers contenus acquis (C,) au moins un desdits premiers évènements étant fonction d'un historique de consommation de contenus;

- - obtenir un premier modèle d'analyse (MA) par apprentissage à partir desdits premiers évènements et premiers contenus associés (EV, C).

Selon au moins un mode de réalisation, ladite mémoire, ledit processeur, ledit module d'intelligence artificielle et ledit module pour acquérir un contenu multimédia, un module pour générer un modèle d'apprentissage configurés pour : acquérir au moins une action en lien avoir un contenu multimédia effectuée lors d'une consommation dudit contenu ; association de ladite action à au moins une portion dudit contenu en cours de consommation ; enregistrement de ladite action et de ladite portion associées en liaison avec ledit utilisateur (par exemple en liaison avec un identifiant dudit utilisateur).

Selon au moins un mode de réalisation, ladite mémoire, ledit processeur, ledit module d'intelligence artificielle et ledit module pour acquérir un contenu multimédia, un module pour générer un modèle d'apprentissage configurés pour :

- acquérir une pluralité de contenus multimédia ;

- générer un modèle d'analyse à partir des couples de données d'apprentissage. L'invention concerne également un serveur ou plateforme de service comprenant un dispositif d'analyse tel que décrit précédemment.

L'invention concerne également un serveur ou plateforme de service comprenant un dispositif d'apprentissage tel que décrit précédemment.

L'invention concerne également une passerelle domestique ou un terminal comportant un dispositif d'analyse tel que décrit précédemment.

L'invention concerne également un système pour analyser un contenu multimédia, comprenant:

- un dispositif d'analyse tel que décrit précédemment,

- un dispositif d'apprentissage tel que décrit précédemment, le système étant configuré de telle manière que le dispositif d'analyse reçoit le modèle d'apprentissage généré par le dispositif d'apprentissage.

L'invention concerne également un programme d'ordinateur comportant des instructions pour la mise en œuvre de l'un des procédés ci-dessus selon l'un quelconque des modes particuliers de réalisation décrits précédemment, lorsque ledit programme est exécuté par un processeur. Le procédé peut être mis en œuvre de diverses manières, notamment sous forme câblée ou sous forme logicielle. Ce programme peut utiliser n'importe quel langage de programmation, et être sous la forme de code source, code objet, ou de code intermédiaire entre code source et code objet, tel que dans une forme partiellement compilée, ou dans n'importe quelle autre forme souhaitable.

L'invention vise aussi un support d'enregistrement ou support d'informations lisible par un ordinateur, et comportant des instructions d'un programme d'ordinateur tel que mentionné ci-dessus. Les supports d'enregistrement mentionnés ci-avant peuvent être n'importe quelle entité ou dispositif capable de stocker le programme. Par exemple, le support peut comporter un moyen de stockage, tel qu'une ROM, par exemple un CD ROM ou une ROM de circuit microélectronique, ou encore un moyen d'enregistrement magnétique, par exemple un disque dur. D'autre part, les supports d'enregistrement peuvent correspondre à un support transmissible tel qu'un signal électrique ou optique, qui peut être acheminé via un câble électrique ou optique, par radio ou par d'autres moyens. Les programmes selon l'invention peuvent être en particulier téléchargés sur un réseau de type Internet.

Alternativement, les supports d'enregistrement peuvent correspondre à un circuit intégré dans lequel le programme est incorporé, le circuit étant adapté pour exécuter ou pour être utilisé dans l'exécution du procédé en question.

Ces dispositifs, système et programme d'ordinateur présentent des caractéristiques et avantages analogues à ceux décrits précédemment en relation avec les procédés d'analyse d'un contenu et d'apprentissage de contenus.

Liste des figures

D'autres caractéristiques et avantages de l'invention apparaîtront plus clairement à la lecture de la description suivante de modes de réalisation particuliers, donnés à titre de simples exemples illustratifs et non limitatifs, et des dessins annexés, parmi lesquels :

[Fig. 1] La figure 1 illustre le contexte d'un mode de réalisation l'invention ;

[Fig. 2] La figure 2 illustre une architecture des dispositifs impliqués dans un système selon un mode de réalisation de l'invention ;

[Fig. 3] La figure 3 illustre des étapes d'un procédé d'apprentissage et d'analyse selon un mode de réalisation de l'invention.

Description d'un mode de réalisation de l'invention Principe général de l'invention

L'idée générale de l'invention est de s'appuyer sur une approche par apprentissage, qui permet par exemple d'entraîner un module d'intelligence artificielle, comme un réseau de neurones, à détecter des événements d'intérêt pour un consommateur (utilisateur) de contenus. Multimédia. Ces événements d'intérêt sont aussi appelés dans la présente demande « événements préférés ». Lors de l'apprentissage, le réseau de neurones évolue pour apprendre à reconnaître un ensemble d'événements d'intérêt dans une pluralité de contenus multimédia. Lors d'une étape ultérieure d'analyse, on peut réaliser une détection automatique d'événements d'intérêt contenus dans le flux audio ou vidéo associé à un nouveau contenu.

Par la suite, on peut déclencher des actions relatives à ce contenu (par exemple notification, zapping ou enregistrement). Par exemple, si un utilisateur regarde la chaîne A, sachant que la chaîne B diffuse un match de football, un mode de réalisation de l'invention lui permet de programmer un zapping automatique sur la chaîne B lorsqu'un but est marqué, en signalant comme événement d'intérêt l'avènement d'un but. Selon un autre exemple, un zapping peut être programmé, lors d'un match impliquant un sportif ou une équipe désignée comme « préférée» par l'utilisateur, en cas d'égalisation du score ou lorsque ce sportif ou cette équipe est entête. Selon encore un autre exemple, un utilisateur qui a précisé l'apparition d'un acteur préféré en tant qu' événement préféré reçoit une notification lorsque l'acteur apparaît dans un contenu qu'il n'est pas en train de regarder. Selon encore un autre exemple, si un contenu en cours de restitution contient une forme (logo par exemple) ou une image particulière, il peut être mis fin à la restitution de ce contenu. Selon encore un autre exemple, si un utilisateur regarde la chaîne A, sachant que la chaîne B diffuse un reportage au sujet duquel il a manifesté un intérêt, un mode de réalisation de l'invention lui permet d'enregistrer automatiquement la chaîne B lorsque le reportage débute.

Modes particuliers de réalisation de l'invention.

La figure 1 représente le contexte général d'un mode de réalisation l'invention, dans lequel un système de télécommunication comporte un premier réseau local ou LAN (Local Area Network, 1) et un réseau de type étendu, ou WAN (Wide Area Network, 2). Selon cet exemple non limitatif, le réseau LAN est un réseau domestique et le réseau WAN est un réseau Internet. Plus largement, un réseau LAN pourrait être un réseau d'entreprise et le réseau WAN 2 pourrait être de n'importe quel type (cellulaire, GSM - Global System for Mobile Communications, UMTS - Universal Mobile Télécommunications System, Wifi - Wireless, DVB- Digital Video Broadcast, etc.) sans sortir du cadre de l'invention.

Selon cet exemple, un élément de gestion du réseau WAN ; par exemple un serveur (5) d'un opérateur de télécommunications, situé par exemple en « tête de réseau », est chargé de la procédure d'apprentissage des contenus.

Selon cet exemple, un second élément de gestion du réseau (6) (comme une passerelle domestique, résidentielle, professionnelle, un hub, etc.) et des équipements terminaux (T1, T2) sont connectés sur le réseau local 1. Il s'agit respectivement selon l'exemple d'un smartphone (T2) et d'un téléviseur (T1). Ces terminaux sont aptes à recevoir sur le réseau local un contenu multimédia en provenance du second élément de gestion du réseau (6) (comme la passerelle domestique). Ces contenus peuvent être issus du réseau local ou du réseau étendu.

On rappelle qu'un réseau local, aussi appelé dans la suite réseau domestique, est un réseau informatique qui relie ensemble, avec ou sans fils, les équipements terminaux, ou plus simplement terminaux, d'une maison (ordinateurs, périphériques d'impression, de stockage, objets connectés, etc.), aptes à communiquer ensemble. Un réseau domestique peut comporter un équipement routeur, aussi communément appelé passerelle, élément intermédiaire assurant la redirection, ou routage, des paquets de données entre les différents terminaux et réseaux qui lui sont connectés. Un utilisateur d'un tel réseau peut exécuter un service donné sur un terminal donné disposant de caractéristiques propres (par exemple, visualiser un contenu multimédia C).

Le contenu multimédia C peut être, sans perte de généralité, issu d'un réseau de type DVB, IP, etc. On rappelle qu'un réseau numérique diffusé de type DVB (acronyme de Digital Video Broadcast) dispose d'une infrastructure sous-jacente pouvant avoir pour support le satellite (SAT), la télévision numérique de terre, ou encore le câble, non représentés. Alternativement ou de manière complémentaire, les terminaux pourraient également être connectés à un réseau de type DVB- IP, aussi appelé IPTV, c'est-à-dire assurant la diffusion de télévision numérique ou la fourniture de contenus, par exemple en VOD (VidéO à la Demande) à partir du réseau Internet sous le contrôle d'un opérateur de service assurant la qualité de la délivrance (par exemple, la TV d'un opérateur, associée à un décodeur numérique et une passerelle domestique du même opérateur). Dans ces deux cas, les contenus numériques multiplexés sont reçus par un décodeur numérique, aussi appelé STB (Set Top Box) via des supports de réception appropriés (antennes, câbles, ADSL, etc.) et les différents programmes qui les constituent sont dé-multiplexés et décodés avant restitution par les terminaux (e.g. téléviseurs) connectés à la STB. Un tel décodeur, non représenté, peut être associé à la passerelle ou directement intégré dans le terminal. Le terminal peut aussi être prévu pour accéder aux contenus streamés à partir du WAN ou du LAN. On parle, dans ce cas, de télévision « connectée », c'est-à-dire que le terminal peut être raccordé au réseau Internet afin de fournir un ensemble de services aux utilisateurs. Si la restitution ne s'effectue pas sous le contrôle d'un opérateur de service, on parle aussi dans ce cas de contenus de type OTT, acronyme de l' appellation anglaise « Over The Top ». La télévision OTT permet à un utilisateur d'un terminal connecté au réseau Internet de restituer des chitines numériques ou des contenus Web sur le téléviseur. Généralement, ce type de terminal « connecté » s 'interface avec la passerelle en charge du réseau local de l'utilisateur et accède par là à un serveur de contenus dans le réseau étendu. Enfin, un tel terminal peut accéder aux contenus depuis l'intérieur de réseau local, par exemple depuis un dispositif de streaming associé à un disque dur local (non représenté). Dans la suite, on parle indifféremment de contenu multimédia pour des contenus reçus à partir d'un réseau de diffusion (DBV, IPTV), en OTT, et/ou via un téléchargement (streaming, téléchargement de fichier, etc.)

Dans tous ces cas de figure, on suppose que le contenu est analysé par un dispositif d'analyse de contenus, qui peut se trouver sur un serveur (5) de l'opérateur, ou sur la passerelle domestique (6), sur un terminal, ou sur tout autre équipement du réseau distant ou local apte à effectuer une telle analyse. Au préalable, un apprentissage a été effectué sur plusieurs contenus. Cet apprentissage s'effectue sur un dispositif d'apprentissage, qui se trouve de préférence sur un serveur (5) de l'opérateur (qui peut être différent ou non du serveur d'analyse) mais pourrait aussi être situé sur la passerelle domestique, ou sur tout autre équipement de réseau apte à réaliser un tel apprentissage.

Comme exposé ci-avant, le procédé selon l'invention comprend un apprentissage et une analyse, qui sont présentés ci-après en deux temps, ou phases distinctes, par simplicité. Il est entendu cependant que, comme souligné ci-avant, l'apprentissage peut être effectué plusieurs fois (notamment en parallèle ou après l'analyse) et que l'analyse peut être continue. :

Ainsi, dans certains modes de réalisation, l'apprentissage peut comprendre d'une part une phase d'apprentissage « en amont » (préalable à la phase analyses) pour caractériser des évènements à partir de contenus, et d'autre part un apprentissage au fil de l'eau des habitudes de l'usager sur ses préférences de consommation de contenus (notamment de contenus analysés selon le procédé d'analyse de l'invention). Les deux apprentissages peuvent être effectués sur un même dispositif (par exemple sur un serveur ou une plateforme de service) ou sur des dispositifs différents (par exemple l'apprentissage amont peut être effectué sur un serveur, l'apprentissage au fil de l'eau étant effectué (localement par exemple) sur une passerelle domestique ou sur un terminal utilisateur). Ainsi ; l'usager peut se voit proposer par exemple des contenus correspondant à ses préférence parmi l'ensemble des contenus en cours de diffusion, avec en outre par exemple une possibilité de passer dynamiquement d'un contenu à l'autre pour ne rien perdre de ses centres d'intérêt.

Première phase : apprentissage de caractéristiques et événements

Dans le mode de réalisation détaillé, dans un premier temps, qui correspond à au moins une phase dite d'apprentissage, N contenus multimédias (où N est un entier naturel) sont sélectionnés, sur lesquels faire un apprentissage de caractéristiques, ou événements, à l'aide par exemple d'un module d'intelligence artificielle. La phase d'apprentissage est par exemple capable de définir des paramètres pour permettre ensuite, à partir de n'importe quel contenu reçu, de fournir en sortie une indication de correspondance entre le contenu reçu et l'un au moins des événements traités par l'apprentissage. Par exemple une telle caractéristique est relative à la présence d'un acteur donné dans le contenu.

Cette phase d'apprentissage est par exemple une phase d'apprentissage automatique, en anglais « machine learning » (ML). On rappelle que l'apprentissage automatique, ou apprentissage statistique, concerne notamment la conception, l'analyse, le développement et l'implémentation de méthodes permettant à une machine (au sens large) d'évoluer par un processus systématique, et ainsi de remplir des tâches difficiles ou problématiques par des moyens algorithmiques. Un exemple possible d'apprentissage automatique est celui de la classification dont le but est d'étiqueter chaque donnée en l'associant à une classe. Selon au moins un mode de réalisation, on utilise par exemple un réseau de neurones (RN). Lors de l'étape d'apprentissage, le réseau évolue pour apprendre à reconnaître un ensemble d'éléments caractéristiques qui permettent de confirmer la présence d'un événement dans un contenu. Par exemple, si on souhaite apprendre à la machine la présence d'un acteur dans une séquence vidéo, on lui présente des films et contenus dans lesquels apparaît cet acteur en l'entraînant à retrouver toutes les séquences où il apparaît. Le même procédé peut s'appliquer pour la détection d'un but dans une séquence sportive, l'identité de l'équipe qui a marqué, la reconnaissance d'un lieu, d'une ville, certaines formes de violence dans les contenus, une chanson, etc.

La phase d'apprentissage fournit en sortie un « modèle » constitué d'un ensemble de données (logiciel, paramètres, coefficients optimisés du réseau de neurones, etc.). Dans la suite on appelle ce modèle « modèle d'analyse » (MA).

Seconde phase : analyse d'un contenu

Dans une seconde phase, dite d'analyse, lorsqu'un contenu est reçu (ou analysé en temps réel sur un support de stockage tel qu'un disque dur), le programme d'analyse est mis en œuvre sur un dispositif d'analyse (DAN). Ce contenu peut être un nouveau contenu, ou un contenu qui a fait partie de l'apprentissage.

Le dispositif d'analyse utilise le (hérite du) modèle d'analyse (MA) fourni par le dispositif d'apprentissage.

Selon au moins un mode de réalisation, le module d'analyse fait appel au réseau de neurones (RN), avec en entrée le modèle d'analyse et le contenu, éventuellement nouveau, à analyser, destiné par exemple à être visualisé et/ou écouté par un ou plusieurs utilisateurs du réseau local si leurs critères (préférences événementielles) sont remplis. Si le module d'analyse détecte la présence (assortie éventuellement d'un indice de fiabilité) d'un événement déclencheur, une action peut être prise relativement à la mise à disposition du contenu pour un ou plusieurs utilisateurs du réseau local (comme un début ou une fin de restitution et/ou d'enregistrement d'un contenu). Par exemple, un utilisateur 1 du terminal T1 pourra recevoir directement le contenu puisque l'un de ses critères (par exemple présence d'un certain acteur, tel qu'un acteur correspondant à une préférence de l'utilisateur 1) a été rencontré, alors qu'un utilisateur 2 du terminal T2 pourra recevoir une notification (selon laquelle, par exemple le contenu C contient une séquence musicale, telle qu'une séquence correspondant à une préférence de l'utilisateur 2).

Selon un mode de réalisation, le module d'analyse peut se trouver sur la passerelle domestique 6. Avantageusement dans ce cas, les préférences des utilisateurs du réseau local peuvent être prises en compte. Par exemple, les caractéristiques associées à un utilisateur peuvent être enregistrées dans un profil relatif à cet utilisateur. Les paramètres du réseau de neurones correspondant aux caractéristiques de déclenchement peuvent avantageusement être mis en œuvre en relation avec cet utilisateur (via ce profil utilisateur notamment). Selon un autre mode de réalisation, le module d'analyse peut se trouver sur un serveur/plateforme d'analyse 5 de l'opérateur. Avantageusement dans ce cas, l'analyse peut par exemple bénéficier d'une puissance de traitement supérieure à celle dont il est possible de bénéficier sur la passerelle domestique 6. Dans un tel mode de réalisation, l'analyse peut de surcroît centralisée. Un contenu ou une notification relative au contenu peut ainsi être envoyée vers la passerelle domestique dans le cas où l'un des contenus reçus par la plateforme contient un événement intéressant le réseau local de la passerelle.

Comme souligné ci-avant, dans certains modes de réalisations, l'analyse peut tenir compte d'un profil et/ou de préférences d'un ou plusieurs utilisateurs. Le procédé peut par exemple comprendre une obtention E10, E30 d'une liste d'événements préférés par au moins un utilisateur et relatifs à des contenus multimédia. Par exemple, un utilisateur peut informer un opérateur du ou des critères (ou évènements) qui l'intéressent. L'utilisation d'un modèle d'analyse peut aussi permettre d'obtenir des évènements susceptibles d'intéresser l'utilisateur en fonction de ses consommations passées de contenus,

La figure 2 illustre une architecture des dispositifs impliqués dans un système selon un mode de réalisation de l'invention.

Le dispositif d'apprentissage DAP possède par exemple l'architecture classique d'un ordinateur et comprend notamment une mémoire M, une unité de traitement UT, équipée par exemple d'un processeur PROC, et pilotée par le programme d'ordinateur PGAP stocké en mémoire M. A l'initialisation, les instructions de code du programme d'ordinateur PGAP sont par exemple chargées dans une mémoire avant d'être exécutées par le processeur PROC. Le processeur PROC de l'unité de traitement UT met notamment en œuvre les étapes du programme d'apprentissage selon l'un quelconque de modes particuliers de réalisation décrits en relation avec les figures 1 et 2, selon les instructions du programme d'ordinateur PGAP.

Le dispositif d'apprentissage peut comporter aussi :

• un module RN d'intelligence artificielle apte à effectuer un apprentissage automatique ;

• un module MA en charge de la génération du modèle d'analyse ; ce module est capable, dans un mode de réalisation, de générer un module d'analyse de complexité variable, en fonction d'un critère de complexité (imposé par le dispositif d'analyse qui mettra en œuvre le module d'analyse) ;

• un module COM1 de communication pour gérer toutes les entrées/sorties du dispositif, notamment acquérir les contenus multimédia, et transmettre le modèle d'analyse à un dispositif d'analyse s'il est distinct du dispositif d'apprentissage ;

• un module pour obtenir les événements à traiter, EVS, par exemple un gestionnaire de base de données ; • optionnellement une base BA pour stocker les couples constitués des contenus et de leurs événements associés alimentant le module RN.

Le dispositif d'analyse DAN a par exemple l'architecture classique d'un ordinateur et peut comprendre aussi :

• une mémoire M', une unité de traitement UT', équipée par exemple d'un processeur PROC', et pilotée par le programme d'ordinateur PGAN stocké en mémoire M'. A l'initialisation, les instructions de code du programme d'ordinateur PGAN d'analyse sont par exemple chargées dans une mémoire avant d'être exécutées par le processeur PROC'.

• Le processeur PROC' de l'unité de traitement UT' met notamment en œuvre les étapes du procédé d'analyse selon l'un quelconque de modes particuliers de réalisation décrits en relation avec les figures 1 et 2, selon les instructions du programme d'ordinateur PGAN. Le programme PGAN est notamment chargé de mettre en œuvre le module d'intelligence artificielle RN avec le modèle d'analyse héritée du dispositif d'apprentissage.

• un module RN d'intelligence artificielle ;

• un module MA en charge de l'obtention et la mise en œuvre du modèle d'analyse ;

• un module de communication pour gérer toutes les entrées/sorties du dispositif, notamment acquérir le contenu multimédia à analyser et le modèle d'analyse MA du dispositif d'apprentissage s'il est distinct du dispositif d'analyse ;

• un module EVS' apte à obtenir le ou les événements) d'intérêt pour l'analyse.

Le terminal T1 a par exemple l'architecture classique d'un ordinateur et peut comprendre aussi :

• Le processeur PROC' de l'unité de traitement UT' met notamment en œuvre au moins partiellement des étapes d'obtention E20 d'événements d'intérêt pour au moins un utilisateur du terminal et de mise à disposition de contenu selon l'un quelconque de modes particuliers de réalisation décrits en relation avec les figures 1 et 2, selon les instructions du programme d'ordinateur PGAN. • un module de communication pour gérer toutes les entrées/sorties du dispositif, notamment acquérir les évènements préférés à transmettre au dispositif d'analyse et recevoir le contenu multimédia à mettre à disposition.

La figure 3 illustre des étapes du procédé de mise à disposition selon un mode de réalisation de l'invention.

Dans une première phase d'apprentissage P1, préalable par exemple à la mise en œuvre en temps réel du réseau de neurones RN, le procédé comporte au moins certaines des étapes d'apprentissage décrites ci-après , en correspondance avec une pluralité d'événements (tels que des acteurs, séquence sportive incluant un tir au but, remise de coupe, film comprenant des scènes de violence extrême, etc.) correspondant par exemple à une pluralité d'utilisateurs (ensemble ou sous- ensemble des abonnés au service audiovisuel de l'opérateur, ensemble des utilisateurs de terminaux du réseau local, etc.). L'apprentissage vise à rendre le modèle d'analyse apte à détecter (ou reconnaître) la pluralité d'évènements dans des contenus destinés à un ou plusieurs utilisateurs.

Selon la figure 3, dans une première étape E0 de la phase d'apprentissage P1, une initialisation du module d'analyse (selon cet exemple un réseau de neurones) est effectuée. Dans la description qui suit, on suppose que l'apprentissage s'effectue sur un ensemble d'événements noté EVS, à soumettre au module d'analyse. L'initialisation du réseau est relative à cet ensemble d'événements. Un événement de l'ensemble EVS peut avoir été obtenu de différentes façons selon les modes de réalisation. Par exemple, il peut avoir été transmis au dispositif d'apprentissage par les passerelles de service, ou avoir être créé par l'opérateur, ou provenir d'un tiers, etc.

Dans une étape E1 de la phase d'apprentissage P1, le procédé acquiert une pluralité (de préférence, un volume important) de contenus numériques C0... CN, de préférence mais pas nécessairement représentatifs des événements « préférés » EVS. En effet, un contenu représentatif d'aucun des évènements « préférés » peut aussi être utile à un apprentissage de la détection de ces évènements préférés. Ces contenus peuvent être choisis par exemple par l'opérateur, manuellement ou automatiquement.

Dans une étape E2 (dite « d'annotation ») de la phase d'apprentissage P1, le procédé comprend une association (par exemple par action humaine) d' au moins certains des contenus acquis dans la première étape E1 à au moins un type d'événement, à partir de l'ensemble EVS des événements. L'ensemble des données correspondant aux couples (contenu, événement) peut constituer par exemple une base d'apprentissage BA.

Dans une étape E3, dite d'apprentissage, de la phase d'apprentissage P1, le procédé met en œuvre l'apprentissage à proprement parler du réseau de neurones RN. Le réseau de neurones, au départ non entraîné par exemple, est alimenté en contenus (notamment en contenus provenant des données de la base d'apprentissage BA) pour le transformer jusqu'à ce qu'il soit davantage apte à faire des analyses pertinentes pour les usagers. A cette fin, il obtient (reçoit) itérativement ou successivement en entrée des données (par exemple des couples (contenu, événement)) provenant par exemple de la base d'apprentissage BA. On notera que la base d'apprentissage est facultative, les données associant contenus et événements pouvant être fournis au réseau de neurones de manière itérative sans faire appel à une base de données.

Dans le mode de réalisation détaillé, le réseau de neurones traite les données associant contenus et événements (tels que les couples (contenu, événement)) obtenues successivement et/ou à chaque itération, pour permettre la mise à jour des coefficients du réseau de neurones RN, afin d'améliorer la convergence de l'algorithme (par exemple jusqu'à obtenir une convergence de l'algorithme). Dans certains modes de réalisation, lorsque les performances de reconnaissance des événements sont jugées correctes, le modèle d'analyse est considéré stable, on peut donc cesser l'apprentissage. Les coefficients du réseau sont dits « figés », « convergés » ou « optimisés ». Ces coefficients optimisés, ainsi que toutes les données utiles à l'implémentation ultérieure du réseau de neurones, peuvent être stockés dans ce qu'on appelle le « module d'analyse » MA qui peut être transmis à des dispositifs d'analyse pour traiter les contenus des usagers.

Par exemple, le réseau de neurones s'entraînant à reconnaître les traits du visage d'un acteur conserve dans son modèle d'apprentissage MA, à l'issue de la phase d'apprentissage, des coefficients optimisés et éventuellement des éléments d'analyse comme les traits du visage sous différents angles, tailles, qualités, etc. pour être capable de le retrouver dans n'importe quel contexte et n'importe quel contenu.

On notera que le réseau de neurones peut être quelconque, de tout type connu, par exemple un réseau de neurones convolutif. Pour cela, le procédé met en œuvre, par exemple, un algorithme itératif du type «algorithme du gradient» avec une approche dite par «descente du gradient» et «back- propagation », pour rechercher les coefficients du réseau de neurones RN permettant d'obtenir la meilleure performance de classification.

Selon un exemple, le réseau de neurones RN comporte:

- une ou plusieurs couches destinées à filtrer et déterminer les éléments caractéristiques des médias du contenu (images, séquences d'images, textes et sons, ...) ; pour cela, il met en œuvre l'application de briques logicielles telles que :

• reconnaissance de formes, mouvements, visages, sons, voix, etc.

• estimation de la violence d'une scène

• etc.

- une ou plusieurs couches connectées réalisant une classification du contenu dans un nombre limité (fini) d'événements ;

- une dernière couche utilisant une fonction permettant d'estimer les probabilités d'appartenance d'un contenu à chaque événement. Une probabilité comprise entre 0 et 1 peut être associée à chaque contenu pour un événement Une telle probabilité peut être convertie en indice de fiabilité. Selon une variante, la base d'apprentissage BA et/ou le modèle d'analyse peuvent être issus de bibliothèques logicielles spécialisées déjà préconstituées (par exemple pré-entraînés).

Selon une variante, le procédé d'apprentissage peut prendre en compte dans son optimisation un critère de complexité, de manière à réaliser par exemple un compromis entre la performance et la complexité (puissance, temps, etc.) de calcul nécessaire. Il est par exemple connu de l'homme du métier que l'on peut contrôler la complexité du réseau de neurones par ajout ou élagage de cellules. On pourra donc adapter selon cet exemple le réseau à la complexité de la machine hébergeant le dispositif d'analyse utilisé (e.g. réduire le nombre de couches el/ou de cellules el/ou le type de cellules si le dispositif d'analyse dispose de capacités limitées, comme par exemple un terminal de type passerelle de réseau, un routeur, un ordinateur domestique, etc.)

A l'issue de cette première phase d'apprentissage, le procédé comprend une deuxième phase P2, dite d'analyse, pour implémenter en temps réel le réseau de neurones RN sur le module d'analyse (et effectuer des inférences du réseau de neurones). Le module d'analyse est situé selon cet exemple dans la passerelle de réseau.

Selon un autre mode de réalisation, elle est située dans un serveur 5 de l'opérateur de réseau.

Dans une étape E30, le modèle d'analyse MA comportant notamment les coefficients optimisés du réseau de neurones, issus de l'apprentissage, est mis en œuvre sur le dispositif d'analyse. Il contrôle le réseau de neurones RN qui, à partir d'un contenu reçu par la passerelle de service (selon un autre mode de réalisation, un serveur 5 de l'opérateur de réseau), délivre une estimation (avec une certaine fiabilité) d'au moins un type d' événement(s) présent(s) dans le contenu, en temps réel. Le type d'évènement peut notamment appartenir à une liste d'évènements d'intérêt (préférés) obtenue E10, E30 (éventuellement via une ou plusieurs passerelles si le dispositif d'analyse est mis en œuvre sur un serveur) d'au moins un utilisateur. Dans une étape E31, si un événement a été détecté dans le contenu avec une fiabilité suffisamment élevée, par exemple si l'indice de fiabilité est supérieur à une valeur seuil donnée, une action de mise à disposition peut être menée : Par mise à disposition par entend par exemple un envoi du contenu vers un terminal (ou vers une passerelle si le module d'analyse se trouve dans le réseau), une notification, un enregistrement, etc.

A titre d'exemple, le contenu peut être joué par le terminal T1 dans une étape E21 (par exemple visualisé par l'utilisateur du terminal).

Outre l'apprentissage du modèle d'analyse, le procédé peut également comprendre un apprentissage des évènements d'intérêt à détecter lors de l'analyse. Par exemple, au moins un évènement d'intérêt peut être obtenu par apprentissage des habitudes et des centres d'intérêt d'au moins un utilisateur (par exemple un historique de consommation de contenues). Un tel apprentissage peut aussi aboutir à une identification (automatique) d'un évènement plus ou moins complexe apprécié par l'utilisateur. La phase d'analyse peut ensuite comprendre une phase de détection de ces évènements d'intérêt. Ainsi, dans certains modes de réalisation, à l'inverse de solutions de l'art antérieur (utilisant par exemple des métadonnées et/ou des données de configuration statiques), il n'est pas nécessaire d'associer à un contenu, avant le début de la consommation de ce contenu, tous les évènements particuliers susceptibles de correspondre à un intérêt d'un utilisateur. Par exemple, un évènement d'intérêt peut être défini par un utilisateur, ou appris automatiquement (via un second modèle d'analyse par exemple) au fin- et mesure des usages de contenus d'un utilisateur (par exemple à chaque usage). Par exemple, des évènements d'intérêt peuvent correspondre à des préférences et/ou à des rejets d'un utilisateur. Le second modèle d'analyse peut par exemple être un second modèle d'analyse d'un second réseau neuronal analysant les préférences d'un utilisateur pour enrichir une bibliothèque d'évènements

Il va de soi que le mode de réalisation qui a été décrit ci-dessus a été donné à titre purement indicatif et nullement limitatif, et que de nombreuses modifications peuvent être facilement apportées par l'homme de l'art sans pour autant sortir du cadre de l'invention.

Notamment, le réseau de neurone peut être remplacé par tout module d'intelligence artificielle apte à remplir les mêmes fonctions (ou des fonctions similaires): apprentissage automatique par arbres de décision, méthodes statistiques, régression logistique, analyse discriminante linéaire, algorithmes génétiques, etc.

Claims

REVENDICATIONS

1. Procédé d'analyse d'un contenu multimédia (C), le procédé étant caractérisé en ce qu'il comporte, sur un dispositif d'analyse (DAN), les étapes suivantes :

- obtenir (E30) des premiers événements audio et/ou vidéo (EVS') relatifs à des premiers contenus multimédia ;

2. Procédé d'analyse d'un contenu multimédia (C) selon la revendication 1 caractérisé en ce que détecter ladite présence comprend générer (E31) une estimation de ladite présence desdits premiers évènements, dans ladite portion dudit second contenu multimédia (C), par un premier modèle d'analyse de contenus audio et/ou vidéo.

3. Procédé d'analyse d'un contenu multimédia (C) selon la revendication 1 ou 2 caractérisé en ce qu'au moins un desdits premier évènements est obtenu depuis une interface utilisateur couplée audit dispositif.

4. Procédé d'analyse d'un contenu multimédia (C) selon l'une quelconque des revendications 1 à

3 caractérisé en ce qu'au moins un desdits premier évènements est obtenu en fonction d'un historique de consommation de contenus.

5. Procédé d'analyse d'un contenu multimédia (C) selon l'une quelconque des revendications 1 à

4 caractérisé en ce qu'au moins un desdits premier évènements est obtenu en utilisant un second modèle d'analyse dudit historique consommation de contenus.

6. Procédé d'analyse d'un contenu multimédia selon l'une quelconque des revendications 1 à 5, caractérisé en ce que le premier modèle d'analyse est celui d'un premier réseau de neurones (RN) et comporte des coefficients du réseau de neurones optimisés par une mise en œuvre sur lesdits premiers contenus , et en ce que en ce que le procédé comporte en outre une étape de :

7. Procédé d'analyse d'un contenu multimédia selon l'une des revendications 1 à 6, caractérisé en ce que déclencher au moins une action portant sur la mise à disposition dudit second contenu multimédia comprend un début ou une fin de restitution dudit second contenu.

8. Procédé d'analyse d'un contenu multimédia selon la revendication 1 à 7, caractérisé en ce que déclencher au moins une action portant sur la mise à disposition dudit premier contenu multimédia comprend une notification de la présence dudit premier contenu sur une interface utilisateur.

9. Procédé d'apprentissage de caractéristiques de contenus multimédia, le procédé étant caractérisé en ce qu'il comporte, sur un dispositif d'apprentissage (DAP) les étapes de :

- acquérir (E1) une pluralité de premiers contenus multimédia ( C0...CN) ;

- associer (E2) au moins un premier événement (EV) à au moins un desdits premiers contenus acquis (C), au moins un desdits premiers évènements étant fonction d'un historique de consommation de contenus;

10. Procédé d'apprentissage de caractéristiques de contenus multimédia selon la revendication 9, caractérisé en ce que le procédé d'apprentissage utilise un réseau de neurones (RN) et en ce que l'étape d'obtenir un premier modèle d'analyse comprend un entraînement du réseau de neurones (RN) par les étapes suivantes :

- recevoir itérativement en entrée desdits premiers contenus et premiers évènements associés

(EV, C). (C, EV) ;

11. Procédé d'apprentissage de caractéristiques de contenus multimédia selon la revendication 9 ou 10 ou 10, caractérisé en ce que le procédé d'apprentissage prend en compte dans son optimisation un critère de complexité.

12. Dispositif (DAN) d'analyse d'un contenu multimédia, comprenant une mémoire (M') , un processeur (PROC'), un module pour acquérir un contenu multimédia (COM2), configurés pour :

13. Dispositif d'apprentissage (DAP) de caractéristiques de contenus multimédia comprenant une mémoire (M),un processeur (PROC), un module d'intelligence artificielle (RN), un module pour acquérir un contenu multimédia (COM1), un module pour générer un modèle d'apprentissage (MA) configurés pour :

- acquérir (E1) une pluralité de premiers contenus multimédia (C0...CN);

- associer (E2) au moins un premier événement (EV) à au moins un desdits premiers contenus acquis (C,) au moins un desdits premiers évènements étant fonction d'un historique de consommation de contenus; - - obtenir un premier modèle d'analyse (MA) par apprentissage à partir desdits premiers évènements et premiers contenus associés (EV, C).

14. Serveur ou plateforme de service comprenant un dispositif d'analyse selon la revendication 12.

15. Serveur ou plateforme de service comprenant un dispositif d'apprentissage selon la revendication 13.

16. Passerelle domestique ou terminal comportant un dispositif d'analyse selon la revendication

12.

17. Système pour analyser un contenu multimédia, comprenant :

- un dispositif d'analyse selon la revendication 12 et

- un dispositif d'apprentissage selon la revendication 13, le système étant configuré de telle manière que le dispositif d'analyse reçoit le modèle d'apprentissage généré par le dispositif d'apprentissage.

18. Programme d'ordinateur apte à être mis en œuvre sur un dispositif tel que défini dans la revendication 12 ou 13, le programme comprenant des instructions de code qui, lorsque le programme est exécuté par un processeur, réalise les étapes du procédé défini selon l'une des revendications 1 à 8 ou 9 à 11.