FR3094856A1

FR3094856A1 - Procede de génération d’un element multimedia au cours de la lecture d’un media, terminal, systeme

Info

Publication number: FR3094856A1
Application number: FR1903530A
Authority: FR
Inventors: Stanislas Coppin; Barthélémy Kiss; Christian Navelot; Yann Mangematin
Original assignee: Unique Entertainment Experience
Current assignee: Unique Entertainment Experience
Priority date: 2019-04-02
Filing date: 2019-04-02
Publication date: 2020-10-09
Anticipated expiration: 2039-04-02
Also published as: FR3094856B1; US20220189076A1; WO2020201158A1; US11995738B2

Abstract

PROCEDE DE G ÉNÉ RATION D’UN ELEMENT MULTIMEDIA AU COURS DE LA LECTURE D’UN MEDIA, TERMINAL, SYSTEME Procédé de génération d’un premier élément multimédia (EM1ji) caractérisé en ce qu’il comporte : Lecture (LEC) d’un premier média (M1) * ; Acquisition (ACQ) d’au moins une image d’au moins un visage d’un utilisateur (U1) ; Détection (EXT) d’une pluralité de points caractéristiques du visage de l’utilisateur (U1); Génération (GEN1) d’au moins un paramètre physiologique (pi) à partir d’au moins un traitement d’au moins un point caractéristique détecté ; Génération (GEN2) d’un premier élément multimédia (EM1 ji) en superposition du premier média (M1) en cours de lecture sur l’afficheur (AF1), ledit premier élément multimédia (EM1 ji) étant déterminé en fonction d’au moins la valeur du paramètre physiologique (pi) ; Émission (EM) simultanément à l’étape de génération d’une donnée numérique (DATA1) déduite de la valeur du paramètre physiologique (pi), ladite donnée numérique (DATA1) comportant en outre un marqueur temporel (ti) dudit premier média (M1). Figure pour l’abrégé : Fig.1

Description

PROCEDE DE GÉNÉRATION D’UN ELEMENT MULTIMEDIA AU COURS DE LA LECTURE D’UN MEDIA, TERMINAL, SYSTEME

Le domaine de l’invention concerne le domaine des méthodes visant à produire des éléments graphiques de manière interactive. Plus particulièrement, le domaine de l’invention se rapporte aux méthodes et dispositifs visant à générer des données numériques et des éléments graphiques prenant en compte des paramètres physiologiques d’un utilisateur.

Il existe actuellement différentes techniques pour générer des éléments multimédias en fonction d’une action d’un utilisateur. Une action utilisateur est généralement une action manuelle réalisée sur une interface de type clavier ou une interface tactile. D’autres moyens peuvent être utilisés pour engager une interaction, par exemple une souris ou une commande à partir de la voix.

Toutefois, il peut être utile de générer une action à partir d’une action de l’utilisateur ne nécessitant pas une interaction manuelle avec une interface de type clavier. Il peut s’agir, par exemple, d’une interaction avec le visage de l’utilisateur. Cela est notamment rendu possible grâce à la présence de caméras sur la plupart des terminaux ou des ordinateurs et au moyen d’algorithmes de reconnaissance de visage.

Toutefois, ces interactions sont ponctuelles, impliquent un unique utilisateur et sont ciblées selon un service donné. A titre d’exemple, on trouve le déverrouillage d’un téléphone intelligent par la reconnaissance de points caractéristiques du visage, le suivi du regard par une reconnaissance de l’Iris notamment pour les applications de viseurs tête haute dans l’aéronautique ou encore des applications de transformations du visage ludiques, dites de « morphing », pour superposer des éléments graphiques à un visage d’un utilisateur ou pour y appliquer des déformations ou des croisements entre différents individus. Il existe d’autres types d’applications dédiés utilisant des points caractéristiques du visage. Toutefois, aucune des solutions actuelles n’offre une exploitation des capacités d’analyse du visage à partir de points caractéristiques pour générer des interactions enrichies.

Il existe donc un besoin de définir une solution qui puisse répondre à cette problématique.

La présente invention vise à résoudre les inconvénients précités.

Selon un premier aspect, l’invention concerne un procédé de génération d’un premier élément multimédia comportant :

Lecture d’un premier média sur un afficheur d’un terminal numérique ;
Acquisition d’au moins une image d’au moins un visage d’un utilisateur à partir d’une optique dudit terminal numérique, ladite acquisition étant réalisée en temps réel lors de la lecture du premier média ;
Détection d’une pluralité de points caractéristiques du visage de l’utilisateur d’au moins une image acquise ;
Génération d’au moins un paramètre physiologique à partir d’au moins un traitement d’au moins un point caractéristique détecté ;
Génération d’un premier élément multimédia en superposition du premier média en cours de lecture sur l’afficheur, ledit premier élément multimédia étant déterminé en fonction d’au moins la valeur du paramètre physiologique ;
Émission d’une donnée numérique déduite de la valeur du paramètre physiologique, ladite donnée numérique comportant en outre un marqueur temporel dudit premier média, ladite émission étant réalisée au moyen d’une interface de communication à destination d’un serveur collectant ladite donnée numérique.

Un avantage de ce mode de réalisation est d’envoyer la donnée numérique avec un décalage de temps vis-à-vis de la génération de l’élément multimédia. Ce décalage peut être utilisé pour réaliser des opérations de prétraitements sur les données acquises de l’utilisateur ou encore pour réaliser des étapes de filtrage. Un intérêt et d’émettre vers le serveur des données restituant un état fidèle des interactions souhaitées et produites par un utilisateur. Selon un mode de réalisation, ce dernier est invité à valider l’envoi de la donnée numérique, par exemple par l’intermédiaire d’un bouton d’action. Selon un exemple, un utilisateur peut rejouer le média une seconde fois et valider chaque élément multimédia qui a été généré suite à une première lecture.

Selon un autre aspect, l’invention concerne un procédé de génération d’un premier élément multimédia comportant :

Lecture d’un premier média sur un afficheur d’un terminal numérique ;
Acquisition d’au moins une image d’au moins un visage d’un utilisateur à partir d’une optique dudit terminal numérique, ladite acquisition étant réalisée en temps réel lors de la lecture du premier média ;
Détection d’une pluralité de points caractéristiques du visage de l’utilisateur d’au moins une image acquise ;
Génération d’au moins un paramètre physiologique à partir d’au moins un traitement d’au moins un point caractéristique détecté ;
Génération d’un premier élément multimédia en superposition du premier média en cours de lecture sur l’afficheur, ledit premier élément multimédia étant déterminé en fonction d’au moins la valeur du paramètre physiologique ;
Émission simultanément à l’étape de génération d’une donnée numérique déduite de la valeur du paramètre physiologique, ladite donnée numérique comportant en outre un marqueur temporel dudit premier média, ladite émission étant réalisée au moyen d’une interface de communication à destination d’un serveur collectant ladite donnée numérique.

Un avantage de ce mode de réalisation est de permettre à un utilisateur de restituer en temps réel au sein d’une communauté d’utilisateurs ses émotions ou ses attitudes qui s’affichent sur le contenu multimédia qui est joué sur son terminal. Par ailleurs, un autre avantage est de réaliser simultanément une émission vers un serveur distant pour partager le paramètre physiologique avec une communauté d’utilisateurs pendant leur future lecture du média. L’intérêt de ce mode de réalisation est de produire un contenu pouvant être diffusé sur une courte échelle de temps au sein d’une communauté en privilégiant la spontanéité des interactions produites.

Selon un mode de réalisation, le procédé comporte préalablement à l’étape de lecture, une sélection d’un premier média parmi une liste prédéfinie de médias.

Selon un mode de réalisation, le procédé comporte préalablement à l’étape de lecture, une génération d’une liste de médias, lesdits médias étant associés à un profil média dont la corrélation avec le profil utilisateur du premier utilisateur définit une valeur supérieure à un seuil. Un avantage est de générer une liste qui soit pertinente pour un utilisateur donné.

Selon un mode de réalisation, l’étape de détection comporte :

un premier traitement comportant une évaluation des positions des points caractéristiques ;
un second traitement comportant une évaluation du mouvement des points caractéristiques, dont au moins un vecteur vitesse,
un troisième traitement comportant une évaluation de la similarité de valeurs obtenues de mêmes traitements d’une pluralité de points caractéristiques.

Un avantage est de définir une très grande variété d’expressions, d’émotions ou d’attitudes d’un large panel d’individus.

Selon un mode de réalisation, la génération d’un paramètre physiologique comporte :

détermination d’un ensemble donné de traitements d’un ensemble de points caractéristiques détectés et ;
comparaison de la valeur obtenue de chaque traitement avec un seuil prédéfini ;
génération d’un paramètre physiologique en fonction du résultat de l’étape de comparaison.

Un avantage est de permettre une définition d’un large éventail de paramètres physiologiques notamment grâce à la possibilité de réaliser des combinaisons très diverses de différents traitements.

Selon un mode de réalisation, chaque paramètre physiologique généré est associé à une donnée de quantification de ce dernier qui est calculée selon une échelle prédéfinie. Un premier avantage est de permettre de prendre en compte différentes échelles d’émotion ou d’attitude pour générer une plus large gamme d’éléments graphiques résultants de la quantification d’un paramètre physiologique, tels qu’un grand sourire ou un léger sourire. Un second avantage est d’améliorer une possible normalisation des paramètres physiologiques à chaque utilisateur en fonction d’un profil utilisateur.

Selon un mode de réalisation, chaque quantification d’un paramètre physiologique est normalisée en fonction d’un profil utilisateur. Un avantage est de générer une même interaction produite au sein d’une communauté de manière homogène entre différents individus.

Selon un mode de réalisation, une étape de calibration est préalablement réalisée dans laquelle au moins une gamme de valeurs d’une quantification d’un paramètre physiologique donné est ajustée selon au moins un coefficient de pondération, ledit coefficient de pondération prenant en compte au moins un élément parmi lesquels :

Une forme générale de visage d’un utilisateur ;
Des positions relatives d’un sous-ensemble de points caractéristiques, lesdites positions définissant des positions de calibration ;
Un mouvement d’un sous-ensemble de points caractéristiques pendant un laps de temps, lesdits mouvements définissant des mouvements de calibration,
Un historique de valeurs de paramètres physiologiques déjà générés pour un utilisateur donné.

Un avantage est de produire une interaction fidèle à l’intention de son auteur et ce quel que soit les particularités culturelles, ethnologiques, de genre ou relatives à tout autre facteur pouvant modifier l’interprétation d’une émotion ou d’une attitude vis-à-vis d’une moyenne ou d’une référence fixée.

Selon un mode de réalisation, la génération d’un premier élément multimédia donné est une fonction d’un paramètre physiologique généré donné, ledit élément multimédia étant sélectionné parmi une liste de premiers éléments multimédias enregistrés dans une mémoire et associés à un élément physiologique donné. Un avantage est de disposer et d’enrichir une large gamme d’éléments multimédias reflétant autant d’expressions, d’attitudes ou d’émotions d’utilisateurs.

Selon un mode de réalisation, la position dans le média, les dimensions, la vitesse d’animation ou la couleur d’un premier élément multimédia généré est une fonction de la quantification du paramètre physiologique généré. Un avantage est d’enrichir le contenu diffusé en prenant en compte un degré de réaction d’au moins un utilisateur.

Selon un mode de réalisation, la durée et/ou la position et/ou la trajectoire d’un élément multimédia sont définies selon la quantification du paramètre physiologique généré. Un avantage est de produire des interactions liées à un niveau de réaction d’un utilisateur.

Selon un mode de réalisation, un élément multimédia est généré pendant une durée prédéfinie à une position prédéfinie sur l’afficheur et réalise une trajectoire donnée. Un avantage est d’utiliser la surface d’affichage de la vidéo pour produire un contenu enrichi. Les animations produites participent à l’expérience de lecture du média et incitent les utilisateurs à exprimer leurs émotions ou leurs réactions en cours de lecture du média.

Selon un mode de réalisation, un élément multimédia peut être une combinaison des éléments multimédias parmi lesquels :

Un texte intégré ou non dans un élément graphique ;
Une image prédéfinie ;
Une image animée,
Un son prédéfini.

Un avantage est de produire des contenus multimédias variés pouvant intégrer un grand nombre d’interactions d’utilisateurs afin d’enrichir la restitution d’une communauté d’utilisateurs sous différentes formes.

Selon un mode de réalisation, un élément multimédia est un émoji, c’est-à-dire une image représentant une émotion ou une humeur déduite d’au moins un paramètre physiologique généré. Un avantage est de produire un élément graphique représentant une indication miroir de l’utilisateur, c’est-à-dire fidèle à l’émotion produite par le visage d’un utilisateur.

Selon un mode de réalisation, lorsqu’un élément physiologique donné est généré, le procédé de l’invention active la lecture d’un second média. Un avantage est de générer un contenu multimédia comportant différents médias, possiblement de natures différentes, telles que des sons, des films ou encore des animations. Un avantage est de produire un contenu déclenché sur une interaction de l’utilisateur ne nécessitant pas d’action manuelle. Un avantage est de produire un contenu en fonction d’une interaction donnée d’un utilisateur.

Selon un mode de réalisation, le premier média est joué pendant une durée prédéfinie jusqu’à un instant prédéfini du média, le procédé générant une boucle de lecture dudit premier média pendant un laps de temps donné. Un avantage est de créer une attente dynamique dans le média. Le média est joué sur une courte boucle d’animation, par exemple 1 à 5s, voire plusieurs secondes jusqu’à quelques minutes. Ainsi, dans le cadre d’un jeu, l’utilisateur a le temps de comprendre qu’il est attendu de sa part qu’il produise une interaction donnée. Selon d’autres contextes, cela permet de valider des étapes de lecture, par exemple lorsqu’il s’agit d’une formation interactive.

Selon un mode de réalisation, le procédé comprend la génération d’une pluralité de seconds éléments multimédia en superposition du premier média affiché sur l’afficheur du premier utilisateur, lesdits seconds éléments multimédias étant générés à des instants donnés et correspondant à des valeurs de paramètres physiologiques précédemment générés d’une pluralité d’utilisateurs ayant visionné le même média. Un avantage est de générer des contenus interactifs prenant en compte de nombreux retours d’une communauté au moment de la lecture du média par un utilisateur donné. Ce dernier peut vivre l’expérience proposée en considérant des réactions ayant déjà été émises par d’autres utilisateurs.

Selon un mode de réalisation, le procédé comprend la génération d’un premier compteur de paramètres physiologiques précédemment générés d’une pluralité d’utilisateurs, chaque paramètre physiologique étant comptabilisé à un moment donné du premier média selon le marqueur temporel lui étant associé. Un avantage est de marquer le média de moments forts pendant lesquels de nombreuses interactions ont été générées. L’utilisateur visionnant un média donné peut à son tour émettre des réactions en générant de nouveaux éléments multimédias qui seront ensuite intégrés à tous les autres déjà agrégés. Un intérêt est donc de faire participer des utilisateurs pour enrichir les données affichées pendant la lecture d’un média et qui lui sont associées.

Selon un mode de réalisation, une étape de collecte des données numériques par un serveur distant comprend, en outre, l’agrégation des données d’une pluralité d’utilisateurs ayant visionné un même premier média, ladite agrégation de données générant au moins une étiquette associée au média. Un avantage est de permettre une nouvelle catégorisation de contenus multimédias. Cette classification a l’avantage d’être plus spontanée qu’une classification conventionnelle. En effet, la classification repose sur des données spontanément émises d’une pluralité d’utilisateurs. Elle offre donc une possibilité de prendre en compte des données émotionnelles d’utilisateurs plus fines qu’une catégorisation classique. Par ailleurs, la classification peut se faire en prenant en compte des émotions tout au long du média. Il y a donc une granularité temporelle qui n’est pas prise en compte dans les systèmes de classification actuels.

Selon un mode de réalisation, l’étiquette d’un média est générée lorsqu’un seuil de nombre donné de paramètres physiologiques donnés générés est atteint dans des fenêtres temporelles prédéfinies vis-à-vis d’un marqueur temporel associé au premier média. Un avantage est de labelliser un média uniquement lorsqu’un nombre suffisant d’interactions d’un même type a été généré. Cette solution évite de prendre en compte des interactions non significatives ou des interactions générées sans réelle relation causale avec le contenu à un instant donné. En outre, cela évite de prendre en considération les éléments multimédias générés avec erreur.

Selon un autre aspect, l’invention concerne un produit programme d’ordinateur comportant au moins une mémoire et un calculateur, ledit programme comprenant des instructions de code de programme exécutées sur un ordinateur pour la mise en œuvre des étapes du procédé de l’invention.

Selon un autre aspect, l’invention concerne un terminal comportant un calculateur, une mémoire et un afficheur pour mettre en œuvre le procédé de l’invention. Un avantage est de permettre de télécharger une application sur un téléphone intelligent. Les médias peuvent alors être directement visionnés depuis un terminal. Chaque terminal peut être configuré avec des données propres à un utilisateur donné.

Selon un autre aspect, l’invention concerne un système comportant une pluralité de terminaux de l’invention, comportant en outre au moins un serveur configuré pour collecter les données émises par lesdits terminaux. Un avantage est de traiter l’ensemble des interactions utilisateur de sorte à créer des indicateurs communautaires permettant d’enrichir la lecture d’un média.

D’autres caractéristiques et avantages de l’invention ressortiront à la lecture de la description détaillée qui suit, en référence aux figures annexées, qui illustrent :

Fig. 1 : un mode de réalisation comportant les principales étapes du procédé de l’invention;

Fig. 2 : un mode de réalisation comportant des étapes préliminaires relatives à la sélection d’un média par un utilisateur;

Fig. 3 : un mode de réalisation du procédé de l’invention dans lequel une interaction utilisateur permet d’activer un nouveau scénario comportant la lecture d’un nouveau média ;

Fig. 4 : un mode de réalisation dans lequel une étape de calibration et une étape d’intégration des éléments graphiques d’une communauté sont générées dynamiquement lors de la lecture d’un média ;

Fig. 5 : un exemple d’architecture du système de l’invention représentant différents terminaux utilisateur et des serveurs pour mettre en œuvre le procédé de l’invention,

Fig. 6 : un exemple de représentations d’éléments graphiques sous la forme d’émojis.

La figure 1 représente des étapes d’une mise en œuvre possible du procédé de l’invention.

Lecture d’un média

Selon un mode de réalisation, le procédé comprend une première étape LEC (M₁) de lecture d’un média M₁. Cette étape est réalisée par exemple au moyen d’un lecteur multimédia. La lecture est réalisée sur un support de type téléphone intelligent, « Smartphone », ou un sur une tablette numérique ou encore un ordinateur. D’une manière générale, le média est joué sur tout type de support numérique présentant un afficheur. Selon un exemple, le média est stocké sur un serveur d’archivage de média. La figure 4 représente deux serveurs SERV₁, SERV₂et trois terminaux T₁, T₂, T₃. Dans ce cas, le terminal d’un premier utilisateur U₁est le premier terminal T₁. Le média est joué sur ce premier terminal T₁. Il peut être préalablement téléchargé depuis le serveur SERV₂distant. Alternativement, il peut être lu en streaming, c’est-à-dire en continu depuis le serveur SERV₂. Dans ce dernier cas, la lecture est réalisée en même temps que le chargement du média. Selon une autre configuration, le média M₁est téléchargé depuis une pluralité de serveurs selon une architecture distribuée.

Selon différents modes de réalisation, le premier média M₁est préférentiellement une vidéo. Elle peut être encodée, compressée ou encryptée selon différents algorithmes. Le format de la vidéo peut être selon les cas d’exemple celui dont les extensions sont les suivants: .mov, .rm, . wmv, .wmf, .mp4, m4v, .mkv. Tous les autres formats de vidéos non énumérés sont également compatibles du procédé de l’invention. Les vidéos peuvent être de différentes durées prédéfinies. Selon un exemple, les vidéos comprennent une séquence d’images racontant une histoire selon une mise en scène donnée et selon un scénario donné dans lequel une action se déroule et des personnages fictifs évoluent. D’autres types d’exemples de vidéos peuvent être mis en œuvre avec le procédé de l’invention, tels que des vidéos filmées ou animées ou des fichiers multimédias combinant des extraits de films et des animations.

Selon un exemple de réalisation, les vidéos sont associées à des dialogues qui peuvent être intégrés dans des bulles. Ces derniers sont destinés à être affichés à des moments prédéfinis dans la vidéo. Des marqueurs temporels peuvent être associés à ces éléments multimédias qui sont représentés.

Selon un exemple, une vidéo est séquencée de sorte à comprendre une pluralité de scènes qui s’enchainent. L’enchainement d’une scène à une autre peut être, par exemple, déclenché lorsqu’un élément multimédia ou lorsqu’un paramètre physiologique est généré par une action de l’utilisateur.

On nomme indifférent dans la suite de la description un élément multimédia et un élément graphique qui désigne la même entité.

Acquisition d’une image du visage

Le procédé de l’invention comprend une étape d’acquisition notée ACQ. L’étape d’acquisition ACQ est préférentiellement réalisée par une acquisition d’images d’un capteur optique. Le capteur optique est par exemple au moins une caméra d’un ordinateur, d’un téléphone intelligent ou d’une tablette. Dans la suite de la description, on désigne cet équipement par un terminal. On entend que généralement la caméra est fixée au terminal est que l’utilisateur oriente le terminal de telle manière à se filmer.

Préférentiellement, l’acquisition est réalisée avec un échantillonnage allant de 60i/s à 1 i/s. D’autres échantillonnages plus ou moins rapides que cette gamme serait compatible du procédé de l’invention. Néanmoins, le choix d’un échantillonnage rapide permet de réaliser des traitements en temps réel. De ce fait, cette configuration fluidifie les interactions de l’utilisateur vis-à-vis du média en cours de lecture. Un échantillonnage de la capture d’image d’un utilisateur allant de 15i/s à 30i/S est par exemple suffisant pour offrir une bonne dynamique de réponse pour générer des éléments multimédias en temps réel. Selon un exemple de réalisation, la vitesse d’acquisition est configurée automatiquement en fonction de paramètres prenant en compte le niveau de batterie, le type de vidéo sélectionnée, la résolution ou la taille de la vidéo jouée ou sa durée ou encore du scénario propre à la vidéo.

Selon d’autres exemples, l’acquisition ACQ est une acquisition d’un son, d’une température, d’une pression, d’un taux d’humidité ou de toute consigne numérique pouvant être générée depuis un capteur et déclenchée spontanément par une action générée dans l’environnement de l’utilisateur du terminal. Dans la suite de la description, l’exemple traité est celui d’une vidéo ou d’un ensemble d’images acquises par la caméra d’un terminal.

Selon un mode de réalisation, l’image acquise par la caméra est une image d’un visage d’un utilisateur U₁. Dans ce cas, l’utilisateur positionne le terminal face à lui de sorte à lire le média M₁en même temps que la caméra est orientée face à son visage.

Détection des points caractéristiques

Le procédé de l’invention met en œuvre un procédé de détection d’un ensemble de points caractéristiques du visage pour en extraire des paramètres de positions, des paramètres cinématiques, des paramètres dynamiques et également des comparaisons de ces différents paramètres pour en déduire des données de symétries ou des signatures géométriques afin de sélectionner un archétype donné.

Une technologie comme celle d’ARkit développée par Apple peut être utilisée, une autre technologie comme celle d'ARCore de Google peut être utilisée. D’autres technologies similaires peuvent être utilisées en combinaison avec l’invention de manière à extraire des points caractéristiques du visage, des positions d’un ensemble de points caractéristiques, des mouvements et vitesses d’un ensemble de points, etc. pour qualifier des signatures géométriques d’une expression, une attitude ou une humeur, etc.

Selon un exemple de réalisation, le procédé de l’invention est capable de définir des signatures géométriques relatives à des expressions faciales très diverses. Notamment, on trouve : le clin d’œil, le clignement des yeux, les deux yeux fermés pendant un laps de temps, le sourire, la bouche ouverte, un mouvement de pommette ou un plissement du front, etc. Le procédé permet également de comparer des évolutions de points caractéristiques du visage présentant une symétrie et évoluant conjointement successivement ou séquentiellement. En outre, la symétrie ou la dissymétrie d’évolution de points caractéristiques du visage peut être comparée de manière à identifier une signature géométrique donnée.

Selon un exemple de réalisation, les points caractéristiques sont des points tels que les extrémités latérales des yeux, le point central de l’iris de l’œil, certains points définissant le contour de la bouche ou encore du nez. Cela peut être des points délimitant une portion du visage. Selon un exemple, les points caractéristiques définissent des courbes telles que des contours de zones du visage ou des formes définissant des zones caractéristiques.

On définit un archétype par la présence d’au moins une signature géométrique donnée. L’archétype se réfère davantage à une expression, une attitude ou une humeur telle que la joie, l’étonnement, etc. La signature géométrique se réfère davantage à la présence d’un sourire dans le visage ou d’un clin d’œil. Généralement, un archétype peut comprendre la présence d’une pluralité de signatures géométriques. Toutefois dans la suite de la description on pourra se référer indifféremment à une signature géométrique ou un archétype dans la mesure où selon un exemple, un archétype peut être défini par la présence d’une unique signature géométrique, telle que la présence d’un clin d’œil.

Traitements des points caractéristiques

L’invention comporte une étape visant à réaliser des traitements sur les points caractéristiques.

Selon un premier traitement T₁, l’évaluation des positions de certains points caractéristiques est réalisée. Les positions peuvent être calculées dans un référentiel lié au plan de l’image et prenant en compte les dimensions caractéristiques du visage. Selon un exemple, les dimensions du visage et l’orientation du visage par rapport au plan focal de la caméra sont corrigées par des coefficients de correction. Un intérêt est d’obtenir un référentiel stable, uniforme et homogène pour référencer des coordonnées de points. Selon un premier exemple, les positions de certains points caractéristiques sont comparées avec des positions de référence de ces mêmes points. Les positions de références peuvent être obtenues par exemple pour une expression du visage donnée d’un utilisateur à un instant donné. Selon un second exemple, les positions des points caractéristiques sont comparées avec les positions calculées à un instant précédent. Ainsi, c’est l’évolution des positions des points caractéristiques relativement dans le temps qui est évaluée. Selon un exemple, les modifications des positions des points caractéristiques sont normalisées selon une échelle prédéfinie.

Dans cet exemple, un déclencheur, dénommé « trigger » dans la terminologie anglo-saxonne, peut être mis en œuvre pour sauvegarder des positions remarquables de points caractéristiques ayant changé de positions simultanément. Ainsi, un sous-ensemble de points caractéristiques ayant changé de positions permet de définir un archétype donné d’expression ou d’humeur du visage. Le premier traitement génère un résultat positif en cas d’un déclenchement suite à une comparaison d’une position avec une référence.

Selon un second traitement T₂, l’évaluation du mouvement de certains points caractéristiques détectés est réalisée. Le mouvement des points peut être évalué par une direction, une durée pendant laquelle des points caractéristiques évoluent. Lorsqu’un mouvement d’un ou plusieurs points caractéristiques est détecté et comparé à un mouvement prédéfini de référence, le traitement peut générer un résultat positif. En outre, des mouvements conjoints de différents points caractéristiques peuvent être corrélés pour détecter une signature géométrique donnée ou directement un archétype donné. La simultanéité des mouvements de certains points peut être également évaluée. En outre, un enchainement ou une séquence de mouvements détectés peut être comparé(e) à une séquence attendue afin de détecter la présence d’une signature géométrique ou un archétype relatif à l’expression du visage d’un utilisateur.

Selon ce second traitement, la vitesse ou l’accélération de certains points caractéristiques peuvent être évaluées. Lorsque ces valeurs relatives à certains points caractéristiques dépassent un seuil prédéfini, un déclencheur permet d’enregistrer des variations particulières. Selon un exemple, des comparaisons ou corrélations entre des variations de différents points permettent de déduire la présence d’une signature géométrique ou d’archétype relatif à une expression donnée du visage de l’utilisateur. Les données de vitesse ou d’accélération peuvent être normalisées selon une échelle prédéfinie de manière à les comparer à des seuils homogènes au cours du temps ou pour les comparer d’une utilisation à une autre. Lors d’un dépassement de seuil, le traitement permet de générer un résultat positif.

Selon un troisième traitement T₃, des comparaisons d’évolutions de la vitesse ou de l’accélération d’un ensemble de points caractéristiques définissant différentes zones du visage sont réalisées. Ces comparaisons permettent d’analyser des modifications symétriques, telles qu’un clignement des yeux, ou des modifications dissymétriques, telles qu’un clin d’œil. Par exemple, un traitement indiquant une symétrie donnée permet de générer un résultat positif.

Un exemple de l’utilisation de la vitesse est par exemple la génération d’un élément graphique correspondant à une bulle. La signature géométrique est une ouverture de la bouche de l’utilisateur enchainée à sa fermeture. La bouche réalise un mouvement tel que le mouvement de la bouche d’un poisson, les deux lèvres se touchent de manière répétée. Dans ce cas, le procédé de l’invention est capable de réaliser autant de bulles que le nombre d’ouvertures de bouche détectées. Afin de distinguer ce cas d’une ouverture de bouche relative à un archétype lié à l’étonnement d’un utilisateur, la vitesse d’évolution des points caractéristiques de la bouche peut être analysée.

Un quatrième traitement T₄peut être mis en œuvre selon le procédé de l’invention. Le quatrième traitement T₄permet de détecter un élément graphique différent que des points ou des zones caractéristiques du visage. Il peut s’agir par exemple de la détection de présence d’une main d’un utilisateur ou d’un mouvement de ladite main. Selon un autre exemple, il peut s’agir d’une donnée de couleur ou de luminosité permettant de déduire une information d’environnement autour de l’utilisateur. Selon un autre exemple, la présence d’une seconde personne dans le champ de la caméra ou d’un passage d’un objet en premier plan ou en second plan, c’est-à-dire derrière l’utilisateur U₁peut être détecté. Lorsqu’un tel traitement T₄permet de déduire une situation donnée, un résultat positif est généré. Les exemples suivants sont possiblement mis en œuvre par le procédé de l’invention : « main devant la bouche », « main sur le front », « main sur la tête à plat, « main sur la tête formant une crête », « pouce levé », etc.

Selon un mode de réalisation, un ensemble de traitement est réalisé en temps réel sur les images acquises par la caméra.

Selon un mode de réalisation, une base de données comportant des archétypes prédéfinis est stockée dans une mémoire. Ces données peuvent être stockées dans une mémoire du terminal ou d’un serveur distant. Les archétypes sont définis par un ensemble de signatures géométriques détectées simultanément ou dans une fenêtre limitée de temps prédéfini. Dans la littérature anglo-saxonne, ces signatures géométriques peuvent être définies comme des « patterns ». Les signatures comprennent la définition d’une pluralité de points caractéristiques définissant au moins une zone du visage et dont le traitement à permis de générer un résultat positif.

Un archétype peut être défini à partir de plusieurs signatures géométriques. En conséquence, lorsque l’intégralité des signatures géométriques d’un archétype est détectée, le procédé de l’invention permet de générer un paramètre physiologique correspondant à l’archétype détecté. Le paramètre physiologique p_iest associé à un élément multimédia EM_1ij. Le paramètre physiologique p_ipeut correspondre à une humeur, une émotion, une réaction, une attitude ou une action de l’utilisateur. A titre d’exemple, on trouve les archétypes suivants : exaspération, surprise, étonnement, effarement, rire, sourire, pouffement de rire, éclat de rire, colère, méfiance, menace, etc.

Les archétypes peuvent correspondre à une combinaison de signatures géométriques détectées simultanément ou de manière séquentielle. Chaque signature géométrique peut être définie par un ensemble de points ayant subi une modification permettant de déclencher des résultats positifs des traitements. Ainsi, certains archétypes comprennent une unique signature géométrique pouvant possiblement comprendre un faible nombre de points caractéristiques et d’autres archétypes peuvent comprendre un grand nombre de signatures géométriques de natures différentes et impactant des zones très éloignées entre elles du visage.

Selon un exemple de réalisation, les signatures géométriques d’un utilisateur U₁sont sauvegardées. Selon un cas, un algorithme de normalisation des signatures géométriques est réalisé, par exemple à partir d’un algorithme d’intelligence artificielle. Un tel algorithme permet de qualifier une signature pour un individu donné, par exemple au cours du temps. A titre d’exemple, la statistique de détection d’une signature géométrique pour un premier individu U₁peut être comprise entre 0,4 et 0,8 sur une échelle de 0 à 1. Dans ce dernier cas, « 0 » correspond à l’absence de signature géométrique et « 1 » correspond à la présence de la signature à un degré maximal. En d’autres termes, l’échelle permet de quantifier la signature géométrique. « 0,8 » peut correspondre par exemple à un grand sourire et « 0,6 » est à un sourire moyen et 0,4 à « un rictus » de l’utilisateur U₁. Pour un second individu U₂, une même signature géométrique peut être comprise entre 0,1 et 1. « 1 » peut correspondre par exemple à un grand sourire et « 0,5 » est à un sourire moyen et 0,1 à « un rictus » de l’utilisateur U₂. On comprend que cette échelle dépend de nombreux facteurs tels que l’âge de l’individu, son origine, sa culture, sa pudeur ou d’un évènement passé, tel que des ruptures amoureuses à répétition qui peuvent provoquer en lui un sourire dit « méfiant » même quand il est supposé être souriant dans son for intérieur. Un intérêt de l’algorithme de normalisation mis en œuvre dans le procédé de l’invention est d’étalonner les traitements du procédé de l’invention pour détecter la présence d’une signature géométrique donnée pour un utilisateur donné. Un tel algorithme permet de "renormaliser" l’échelle de quantification d’une signature géométrique donnée. La figure 4 représente une étape CAL_U1qui correspond à une étape de calcul prenant en compte un élément de l’utilisateur U₁et par exemple de son profil Pu₁ _afind’affinerla détection des points caractéristiques, éventuellement réaliser une étape de correction ou de normalisation pour générer un paramètre physiologique normalisé.

Lorsqu’un paramètre physiologique est généré, le procédé de l’invention génère automatiquement un élément multimédia EM_1ijqui lui est associé dans une base de données. L’étape de génération d’un élément physiologique est notée GEN₁et l’étape de génération d’un élément graphique est notée GEN₂ sur la figure 1.

L’élément multimédia EM_1ijest alors affiché sur l’afficheur de l’utilisateur U₁en superposition de la vidéo M₁qui est en lecture. L’affichage, noté AFF sur la figure 1, peut être réalisé sur une bordure de l’afficheur ou en bordure du lecteur utilisé pour lire la vidéo ou de la vidéo elle-même lorsqu’elle est intégrée dans un environnement graphique. A titre d’exemple, l’élément multimédia EM_1ijest généré depuis la partie inférieure de la vidéo M₁. Selon un exemple, l’élément multimédia EM_1ijest animé en superposition de la vidéo qui est jouée. L’animation de l’élément multimédia peut comprendre la génération d’un mouvement de ce dernier, par exemple de bas vers le haut. D’autres animations peuvent être réalisées telles qu’un mouvement de vibration, un mouvement formant une courbe, ou encore en rotation de l’élément graphique autour d’un point défini sur l’élément graphique lui-même. Selon un exemple, l’élément graphique EM_1ijchange de couleur, grossit ou rétrécit. Par exemple dans le cas d’une bulle, cette dernière peut exploser à la fin d’une course qu’elle réalise en s’élevant vers le haut de la vidéo. Selon un autre exemple, l’élément graphique EM_1i _jest affiché pendant un laps de temps avant de disparaitre. Sa disparation peut être réalisée progressivement en appliquant une transparence progressive à l’élément graphique EM_1i.

Selon un exemple, les éléments graphiques EM_1ijsont des emojis. Les émojis sont par exemple associés aux paramètres physiologiques de sorte à représenter graphiquement une émotion, une attitude ou une expression d’un utilisateur U₁. Ainsi, la production des éléments graphiques EM_1ijest réalisée de manière à offrir une interaction miroir de l’expression d’un utilisateur. La figure 6 représente des exemples d’émojis pouvant être générés selon différents paramètres physiologiques générés.

Un premier emoji EM₁₁a un œil fermé et une langue tirée, il peut être généré lorsque des signatures géométriques correspondantes ont été détectées à partir des traitements réalisés sur les données caractéristiques, telles que des points, des courbes, des formes caractéristiques. Un second exemple EM₁₂représente un emoji comportant les deux yeux ouverts et une langue tirée. Un troisième exemple EM₁ ₃représente un émoji comportant les deux yeux fermés et une ouche caractérisant une déception ou un mécontentement. Un quatrième exemple EM₁ ₄représente un émoji ayant une bouche ouverte et les yeux au ciel caractérisant l’étonnement.

Selon un autre exemple, les éléments graphiques EM_1ijsont des textes, par exemple intégrés dans des bulles. Les textes peuvent être affichés dans des zones dédiées du média tel que des zones où des personnages apparaissent.

Selon un mode de réalisation, le média M₁est joué jusqu’à un instant donné prédéfini par un marqueur temporel. Le marqueur temporel peut être exploité comme métadonnée du média ou il peut être contrôlé depuis un serveur distant. L’instant auquel le média en attente est prédéfini. Le média M₁est, par exemple, joué en boucle sur une courte séquence. Lors de la détection d’une interaction utilisateur donnée, le média reprend alors sa lecture. L’interaction utilisateur peut correspondre à la détection d’un élément physiologique détecté par le terminal ou par un serveur distant. Selon un cas de figure, c’est un serveur distant qui active les différentes séquences du média M₁en fonction des éléments physiologiques reçus. Par exemple, un clin d’œil peut être attendu afin de poursuivre la lecture du média. Dans ce cas, soit le média est figé à un instant donné, soit il est joué en boucle sur la dernière seconde du média. Le temps pendant lequel le média est en boucle est configuré à l’avance et peut être adapté à chaque séquence.

Émission des données vers un serveur

Le procédé de l’invention comprend une étape TR visant à émettre des données DATA₁vers un serveur distant, par exemple SERV₁. Les données DATA₁comprennent, par exemple, une première donnée décrivant l’élément physiologique pi qui a été généré préalablement. Alternativement, les premières données comprennent directement les signatures géométriques qui ont permis de déterminer l’élément physiologique généré pi. Les données DATA₁émises comprennent en outre des secondes données comportant au moins un marqueur temporel t_i. Le marqueur temporel ti correspond à l’instant auquel le paramètre physiologique pi a été généré dans le repère temporel du média M₁. Ainsi, les données DATA₁comprennent au moins un couple de valeur (p_i, t_i). Selon un cas de figure, les données DATA1 comprennent un identifiant de média M1 et un identifiant d’utilisateur ID_U1ou alternativement un profil utilisateur Pu₁.

Un serveur distant SERV₁reçoit les données émises par le terminal T₁de l’utilisateur U₁. Selon un mode de réalisation, le serveur SERV₁reçoit à chaque instant une pluralité de données DATA₁émises depuis une multitude de terminaux d’une pluralité d’utilisateurs. Des architectures distribuées permettent de réaliser cette collecte de données provenant de différents terminaux par une pluralité de serveurs. La suite de la description détaille le cas d’un unique serveur de collecte, toutefois le procédé de l’invention concerne tous les modes de réalisation mis en œuvre avec des architectures distribuées de différentes manières.

Le serveur SERV₁collecte les données DATA₁émises par différents utilisateurs. Les données sont classées par média et sont ensuite agrégées de sorte à alimenter un compteur temporel de paramètres physiologiques. Ainsi, à chaque instant d’un média M₁, le procédé de l’invention permet de comptabiliser le nombre de paramètres physiologiques cumulés lors de la lecture du média.

Selon un mode de réalisation, le compteur est généré par le serveur SERV₁ou un autre serveur à chaque lecture du média par un utilisateur donné. Cette étape est notée GEN₀sur la figure 4 et illustre que la lecture de la vidéo est simultanément réalisée avec la superposition d’un compteur affiché sur le média M₁. Un intérêt est de représenter un volume d’interactions d’une communauté ayant réagi sur un même média, par exemple, à des moments forts du média M₁.

Selon un mode de réalisation, les éléments physiologiques collectés auprès d’une pluralité d’utilisateurs sont triés par catégorie de sorte que les mêmes éléments physiologiques sont répertoriés à chaque instant du média M₁. Ceci est rendu possible grâce à l’analyse des marqueurs temporels associés à chaque élément physiologique généré. Ainsi, il est possible de restituer des indicateurs communautaires EM_2ijémanant d’une pluralité d’éléments physiologiques générés d’une pluralité d’utilisateurs aux mêmes instants ou dans une fenêtre temporelle réduite. Cet indicateur communautaire EM_2ijpeut prendre la forme d’un élément graphique du même type que les éléments graphiques EM₁ _ijgénérés par chaque utilisateur. L’indicateur communautaire peut alors être généré par le serveur SERV₁à destination des utilisateurs visualisant le média M₁en cours de lecture. L’indicateur communautaire EM_2ijest alors superposé au cours de la lecture du média M₁. A chaque instant un nouvel indicateur communautaire est susceptible d’être affiché en superposition du média M₁lu.

Dans cette configuration, lorsqu’un média M₁est joué sur un terminal T₁d’un utilisateur U₁, des indicateurs communautaires EM_2ijsont affichés en superposition du média M₁et des éléments graphiques EM_1ijde l’utilisateur U₁sont également affichés en superposition du média.

Selon un mode de réalisation, les éléments graphiques EM_1ijpeuvent évoluer dans une zone donnée du média et les indicateurs communautaires EM₂ _ijpeuvent évoluer dans une autre zone du média au même moment.

Les indicateurs communautaires sont par exemple des émojis. Dans certains modes de réalisation, les indicateurs communautaires peuvent être éléments graphiques dimensionnés en proportion du nombre d’éléments physiologiques collectés d’un même type. Selon un exemple, le nombre d’éléments physiologiques d’un indicateur communautaire est affiché, par exemple lorsqu’un seuil est dépassé. Selon un exemple, les indicateurs communautaires sont animés, l’animation peut par exemple dépendre du nombre d’indicateurs physiologiques collectés à un instant donné d’un média M₁. Un intérêt d’un tel retour issu d’une communauté d’utilisateurs en superposition du média est de restituer pour un utilisateur donné une interaction collective pouvant l’inviter à interagir également. Selon un exemple, un élément graphique EM₁ _ijrare, c’est-à-dire relativement peu généré par la communauté, peut être affiché plus longtemps ou être affiché dans des dimensions plus importantes que les autres éléments graphiques EM₁ _ij. Identiquement, un indicateur communautaire EM_2ijpeut également être généré pour des éléments physiologiques reçus rares ou peu générés par une communauté d’utilisateurs. La prise en compte de la rareté d’un élément physiologique généré permet d’inviter d’autres utilisateurs à enrichir leurs interactions lors de la lecture d’un média M₁.

Selon un mode de réalisation, les indicateurs physiologiques p_ipeuvent être utilisés pour profiler des médias, c’est-à-dire les catégoriser ou les « tagger ». Un intérêt est de classifier une bibliothèque de médias sur un critère d’interaction spontané d’un ensemble d’utilisateurs. Lors de l’exploitation des médias ainsi profilés, le procédé de l’invention peut prendre en compte, selon le profil d’un utilisateur, une catégorie donnée de média. Un média peut être classé comme "surprenant", un autre comme "hilarant" et encore un autre comme "choquant".

Le procédé de l’invention permet d’offrir une autre possibilité de classer du contenu multimédia et une autre manière de consommer des médias. Un avantage est d’offrir une solution très performante en termes d’exploitation d’une bibliothèque multimédia, par exemple lorsque les médias sont des vidéos. Un avantage est également de restituer instantanément des émotions lors de la lecture d’un média. Un avantage est d’obtenir des retours plus spontanés et moins intellectualisés lors d’une restitution ultérieure après l’expérience de lecture du média.

La figure 2 représente des étapes préliminaires pouvant être réalisées avant le procédé de l’invention. Une étape de sélection d’un média notée SEL permet à un utilisateur de choisir le média qu’il souhaite visualiser. Préalablement, une étape GEN_LISTest, par exemple, réalisée par le procédé de l’invention. La liste générée de médias peut l’être en prenant en compte une date de média, une popularité du média, un nombre d’éléments physiologiques générés par média. Selon un autre exemple, la liste est générée en fonction du profil utilisateur Pu. Le procédé comporte alors une étape visant à exploiter des données utilisateur qui sont enregistrées dans une mémoire. Les données utilisateur peuvent correspondre à des préférences définies par ce dernier ou bien elles peuvent correspondre à des données collectées au cours des précédentes lectures. Les données ainsi collectées permettent de définir des préférences d’un utilisateur.

Selon un mode de réalisation, les médias Mi et leur catégorie sont pris en compte pour générer une liste pertinente pour un utilisateur donné. Ainsi, un média M₁peut comprendre un profil média P_M1. Une étape de corrélation des données d’un profil média P_M1et du profil utilisateur P_U1peut être mise en œuvre préalablement à la génération de la liste de média M₁. Cette corrélation peut être appliquée à un ensemble de médias noté ΣM_i.

Les principales étapes du procédé sont notées PROC₁ dans la figure 1 et sont donc désignées ainsi dans la figure 2.

La figure 3 représente un cas d’interaction d’un utilisateur U1 pendant la lecture d’un média M1 dans lequel un élément physiologique génère un changement de média. Ainsi la lecture du média M1 est alors interrompue pour activer un média M2 ou un média M3. Selon un cas d’exemple, le changement de média est scénarisé de sorte que le premier média M₁est joué jusqu’à un marqueur temporel donné. Lorsque le premier média M₁est joué jusqu’à atteindre le marqueur temporel prédéfini, une courte séquence du média M₁est jouée en boucle comme précédemment évoquée. Le média M₁est alors joué jusqu’à ce que l’utilisateur U₁provoque un changement de média en interagissant avec ce dernier. L’interaction peut correspondre à un élément physiologique pi attendu et détecté. Identiquement, le traitement qui suit est soit réalisé en local au sein du terminal, soit par un serveur distant qui active la suite de la lecture.

Dans le cas de figure de la figure 3, lorsque le procédé génère GEN(p₁) un premier élément physiologique p₁consécutivement à une interaction utilisateur donné à un instant donné de la lecture du média M₁, l’étape de lecture d’un second média M₂est activée. Dans le cas de la figure 3, on considère le cas où un autre scénario aurait pu se produire avec la lecture du média M₃ au même instant et de manière alternative à la lecture du média M₂. La lecture du média M₃aurait pu survenir si le procédé de l’invention avait généré un élément physiologique p₂. Les étapes qui sont ensuite réalisées lors de la lecture du média M₂ou M₃sont similaires aux étapes de la figure 1. Un avantage est de permettre de définir des expériences utilisateur comportant un scénario mettant en œuvre différents médias qui sont activés en fonction des émotions d’un utilisateur.

Selon un autre mode de réalisation de l’invention, un enchainement de médias est réalisé de sorte que chaque média est généré et affiché en fonction d’interactions utilisateur données. Les éléments physiologiques attendus et activant un changement de média peuvent être prédéfinis.

La figure 5 représente un exemple d’architecture permettant de mettre en œuvre le procédé de l’invention. Un ensemble de terminaux utilisateurs T₁, T₂, T₃est représenté. Un premier serveur SERV₁permet de réaliser les principales étapes du procédé de l’invention. Un réseau de données, noté NET, tel qu’internet peut être utilisé pour échanger des données numériques entre les différentes entités représentées. Les serveurs SERV1, SERV2 peuvent être configurés pour réaliser différentes fonctions ou des fonctions similaires, telles que l’émission d’un contenu média, la collecte de données utilisateur, le calcul d’indicateurs communautaires, l’identification d’un utilisateur à un service, etc.

Claims

Procédé de génération d’un premier élément multimédia (EM₁ _ji) caractérisé en ce qu’il comporte :
Lecture (LEC) d’un premier média (M₁) sur un afficheur (AF₁) d’un terminal numérique (T₁) ;

Acquisition (ACQ) d’au moins une image d’ au moins un visage d’un utilisateur (U₁) à partir d’une optique dudit terminal numérique (T₁), ladite acquisition (ACQ) étant réalisée en temps réel lors de la lecture du premier média (M₁) ;

Détection (EXT) d’une pluralité de points caractéristiques du visage de l’utilisateur (U₁) d’au moins une image acquise ;

Génération (GEN₁) d’au moins un paramètre physiologique (p_i) à partir d’au moins un traitement d’au moins un point caractéristique détecté ;

Génération (GEN₂) d’un premier élément multimédia (EM₁ _ji) en superposition du premier média (M₁) en cours de lecture sur l’afficheur (AF₁), ledit premier élément multimédia (EM₁ _ji) étant déterminé en fonction d’au moins la valeur du paramètre physiologique (p_i) ;

Émission (EM) simultanément à l’étape de génération d’une donnée numérique (DATA₁) déduite de la valeur du paramètre physiologique (p_i), ladite donnée numérique (DATA₁) comportant en outre un marqueur temporel (t_i) dudit premier média (M₁), ladite émission (EM) étant réalisée au moyen d’une interface de communication à destination d’un serveur (SERV) collectant ladite donnée numérique (DATA₁).
Procédé selon la revendication 1, caractérisé en ce qu’il comporte préalablement à l’étape de lecture (SEC):
Génération d’une liste (GEM_LIST) de médias (Mi), lesdits médias (Mi) étant associés à un profil média (Pm) dont la corrélation avec le profil utilisateur (Pu) du premier utilisateur (U₁) définit une valeur supérieure à un seuil ;

Sélection (SEL) d’un premier média parmi une liste prédéfinie de médias (Mi).
Procédé selon l’une quelconque des revendications 1 à 2, caractérisé en ce que l’étape de détection (EXT) comporte :
un premier traitement (T₁) comportant une évaluation des positions des points caractéristiques ;

un second traitement (T₂) comportant une évaluation du mouvement des points caractéristiques, dont au moins un vecteur vitesse,

un troisième traitement (T₃) comportant une évaluation de la similarité de valeurs obtenues de mêmes traitements d’une pluralité de points caractéristiques.
Procédé selon la revendication 3, caractérisé en ce que la génération (GEN₂) d’un paramètre physiologique (pi) comporte :
détermination d’un ensemble donné de traitements d’un ensemble de points caractéristiques détectés et ;

comparaison de la valeur obtenue de chaque traitement avec un seuil prédéfini ;

génération d’un paramètre physiologique (pi) en fonction du résultat de l’étape de comparaison.
Procédé selon l’une quelconque des revendications 1 à 4, caractérisé en ce que chaque paramètre physiologique généré est associé à une donnée de quantification de ce dernier qui est calculée selon une échelle prédéfinie.
Procédé selon l’une quelconque des revendications 1 à 5, caractérisé en ce que chaque quantification d’un paramètre physiologique est normalisée en fonction d’un profil utilisateur (Pu).
Procédé selon l’une quelconque des revendications 5 à 6, caractérisé en ce qu’une étape de calibration est préalablement réalisée dans laquelle au moins une gamme de valeurs d’une quantification d’un paramètre physiologique (pi) donné est ajustée selon au moins un coefficient de pondération, ledit coefficient de pondération prenant en compte au moins un élément parmi lesquels :
Une forme générale de visage d’un utilisateur ;

Des positions relatives d’un sous-ensemble de points caractéristiques, lesdites positions définissant des positions de calibration ;

Un mouvement d’un sous-ensemble de points caractéristiques pendant un laps de temps, lesdits mouvements définissant des mouvements de calibration,

Un historique de valeurs de paramètres physiologiques déjà générés pour un utilisateur donné.
Procédé selon l’une quelconque des revendications 1 à 7, caractérisé en ce que la génération (GEN₂) d’un premier élément multimédia (EM₁ _ji) donné est une fonction d’un paramètre physiologique généré donné, ledit élément multimédia (EM₁ _ji) étant sélectionné parmi une liste de premiers éléments multimédias (EM₁ _ji) enregistrés dans une mémoire et associés à un élément physiologique donné (pi), ledit élément multimédia (EM₁ _ji) étant généré pendant une durée prédéfinie à une position prédéfinie sur l’afficheur et réalise une trajectoire donnée.
Procédé selon la revendication 8, caractérisé en ce que :
la position dans le média, les dimensions, la vitesse d’animation ou la couleur d’un premier élément multimédia (EM₁ _ji) généré est une fonction de la quantification du paramètre physiologique généré ; et/ou,

la durée et/ou la position et/ou la trajectoire d’un élément multimédia (EM_ji)
est/sont définie(s) selon la quantification du paramètre physiologique généré.
Procédé selon l’une quelconque des revendications 1 à 9, caractérisé en ce qu’un élément multimédia (EM_ji) peut être une combinaison des éléments multimédias parmi lesquels :
Un texte intégré ou non dans un élément graphique ;

Une image prédéfinie ;

Une image animée ;

Un son prédéfini,

Un émoji, c’est-à-dire une image représentant une émotion ou une humeur déduite d’au moins un paramètre physiologique généré.
Procédé selon l’une quelconque des revendications 1 à 10, caractérisé en ce que lorsqu’un élément physiologique donné est généré, le procédé de l’invention active la lecture d’un second média (M₂, M₃).
Procédé selon l’une quelconque des revendications 1 à 11, caractérisé en ce que le premier média (M₁) est joué pendant une durée prédéfinie jusqu’à un instant prédéfini du média, le procédé générant une boucle de lecture dudit premier média (M₁) pendant un laps de temps donné.
Procédé selon l’une quelconque des revendications 1 à 12, caractérisé en ce qu’il comprend la génération (GEN₀) d’une pluralité de seconds éléments multimédia (EM_2i _j) en superposition du premier média (M₁) affiché sur l’afficheur du premier utilisateur (U₁), lesdits seconds éléments multimédias (EM_2ij) étant générés à des instants donnés et correspondant à des valeurs de paramètres physiologiques précédemment générés d’une pluralité d’utilisateurs ayant visionnée le même média (M₁).
Procédé selon l’une quelconque des revendications 1 à 13, caractérisé en ce qu’il comprend la génération (GEN₀) d’un premier compteur de paramètres physiologiques (pi) précédemment générés d’une pluralité d’utilisateurs, chaque paramètre physiologique (pi) étant comptabilisé à un moment donné du premier média (M₁) selon le marqueur temporel lui étant associé.
Procédé selon l’une quelconque des revendications 1 à 14, caractérisé en ce qu’une étape de collecte des données numériques (DATA₁) par un serveur distant (SERV) comprend, en outre, l’agrégation des données d’une pluralité d’utilisateurs (U_i) ayant visionné un même premier média (M₁), ladite agrégation de données générant au moins une étiquette associée au média, l’étiquette étant générée lorsqu’un seuil de nombre donné de paramètres physiologiques donnés générés est atteint dans des fenêtres temporelles prédéfinies vis-à-vis d’un marqueur temporel associé au premier média (M₁).
Produit programme d’ordinateur comprenant des moyens de code de programme enregistrés sur un support lisible par un ordinateur, pour mettre en œuvre des étapes de procédé de l’une quelconque des revendications 1 à 15 lorsque ledit programme est exécuté sur un ordinateur.
Terminal (T₁, T₂, T₃) comportant un calculateur, une mémoire et un afficheur pour mettre en œuvre le procédé de l’une quelconque des revendications 1 à 15.
Système comportant une pluralité de terminaux selon la revendication 17, caractérisé en ce qu’il comporte en outre au moins un serveur (SERV1, SERV2) configuré pour collecter les données (DATA₁) émises par lesdits terminaux (T₁, T₂, T₃).