FR3047097A1 - Procede de selection d'au moins une sequence d'un contenu multimedia basee sur l'audience sociale - Google Patents

Procede de selection d'au moins une sequence d'un contenu multimedia basee sur l'audience sociale Download PDF

Info

Publication number
FR3047097A1
FR3047097A1 FR1656237A FR1656237A FR3047097A1 FR 3047097 A1 FR3047097 A1 FR 3047097A1 FR 1656237 A FR1656237 A FR 1656237A FR 1656237 A FR1656237 A FR 1656237A FR 3047097 A1 FR3047097 A1 FR 3047097A1
Authority
FR
France
Prior art keywords
comments
histogram
multimedia content
time
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
FR1656237A
Other languages
English (en)
Inventor
Fabien Bareti
Fabrice Clerot
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
Orange SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Orange SA filed Critical Orange SA
Priority to FR1656237A priority Critical patent/FR3047097A1/fr
Publication of FR3047097A1 publication Critical patent/FR3047097A1/fr
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

L'invention se rapporte à un procédé de sélection d'au moins une séquence d'un contenu multimédia, en rapport avec le contenu, émis en ligne sur une source digitale d'un type donné, le procédé comprenant les étapes suivantes : a. une étape d'obtention sur au moins une partie de la durée d'un contenu multimédia, d'un histogramme du nombre de commentaires, les commentaires étant distribués sur des intervalles de temps prédéfinis, b. une étape d'extraction, à partir de l'histogramme, de l'instant associé à un intervalle de temps présentant un pic de commentaires, c. une étape de détermination d'une plage de temps fonction de l'instant extrait, d. une étape d'extraction, du contenu multimédia, d'une séquence correspondant à la dite plage de temps.

Description

Procédé de sélection d'au moins une séquence d'un contenu multimédia basée sur l'audience sociale
Domaine technique L’invention se rapporte au domaine des télécommunications. L'invention concerne tout particulièrement un procédé de sélection d'au moins une séquence d'un contenu multimédia basée sur l'audience sociale. Un contenu multimédia vise tout contenu multimédia pouvant être commenté, à savoir une émission télévisée (aussi appelé programme télévisé), une émission de radio, etc. Les contenus visés sont transportés via un réseau de diffusion comportant plusieurs canaux ou flux de données, par exemple des chaînes de télévision.
Un réseau de diffusion de contenus multimédia est quelconque ; par exemple, celui-ci peut être un réseau hertzien, numérique, un réseau Internet, etc.
Une source digitale de données émises en ligne, et représentant un fournisseur de services en ligne, est quelconque ; par exemple, celle-ci peut-être un réseau social, un site internet, etc.
Par audience sociale d'un contenu multimédia, est entendue la mesure du volume d'interactions sociales en rapport avec le contenu multimédia, réalisées en ligne sur une source digitale.
Par séquence d'un contenu, est entendue une sous-partie de ce contenu définie par une durée et/ou des instants de diffusion sur un réseau de diffusion donné.
Un fournisseur de services en ligne ou un réseau de diffusion de contenus multimédia disposent d'un ensemble de dispositifs permettant d'échanger et de traiter des données. Les termes de plateforme ou plateforme de services seront utilisés indifféremment pour désigner l'ensemble de ces dispositifs.
Le dispositif de l'invention est un dispositif équipé d'au moins un processeur capable d'interagir avec des modules extérieurs et de traiter de l'information. Ce dispositif est, par exemple, un ordinateur.
Etat de la technique
De nombreux programmes télévisés reposent sur le concept de rediffusion d'un assemblage de séquences de contenus audiovisuels déjà précédemment diffusés sur une ou plusieurs chaînes de télévision. La sélection de ces séquences est aujourd'hui essentiellement réalisée manuellement par l'humain, qui visualise plusieurs chaînes de télévision sur une plage temporelle donnée, par exemple sur une journée, et qui en extrait les moments les plus marquants. Le coût de réalisation de ce procédé non automatisé est, de fait, conséquent.
Des téléspectateurs - plus nombreux - visualisent pourtant déjà ces programmes, et relèvent la pertinence de moments télévisés à travers leurs commentaires émis en ligne. Ces réactions répondent souvent aux mêmes codes de pertinence que ceux recherchés par le personnel humain professionnel. Les services en ligne où se partagent ces commentaires sont des réseaux sociaux généralistes, tels que Facebook, Twitter, ou bien des sites Internet ou des applications type application mobile, dédiés aux commentaires des téléspectateurs sur les programmes télévisés.
Un constat est qu'il n'existe pas de procédé analysant a posteriori la corrélation entre des événements marquants et observables en parallèle sur les deux types de réseaux suivants : un réseau de diffusion de contenus multimédia et un réseau de commentaires relatifs à ces contenus. L’invention offre une solution ne présentant pas les inconvénients de l’état de la technique. L'invention A cet effet, selon un aspect fonctionnel, l'invention a pour objet un procédé de sélection d'au moins une séquence d'un contenu multimédia à partir de commentaires d'utilisateurs, en rapport avec le contenu, émis en ligne sur une source digitale d'un type donné, le procédé comprenant les étapes suivantes : - obtention sur au moins une partie de la durée d'un contenu multimédia, d'un histogramme du nombre de commentaires, les commentaires étant distribués sur des intervalles de temps prédéfinis, - extraction, à partir de l'histogramme, de l'instant associé à un intervalle de temps présentant un pic de commentaires, - détermination d'une plage de temps fonction de l'instant extrait, - extraction, du contenu multimédia, d'une séquence correspondant à ladite plage de temps. L'invention met en œuvre un dispositif de sélection qui, à partir d'informations reçues sur l'audience sociale d'un contenu multimédia et de l'observation d'un nombre de commentaires ponctuellement élevé dans le temps, détermine les caractéristiques d'extraction d'une séquence de ce contenu.
Ainsi, l’invention offre l’avantage d'obtenir de manière automatisée une séquence d'un contenu multimédia à l'origine d'un maximum local de commentaires, appelé également un pic de commentaires, avec un résultat de pertinence élevé sur le choix de cette séquence.
Selon un premier mode de mise en œuvre particulier de l’invention, si la sélection concerne une pluralité de séquences, les séquences sont assemblées pour former une chaîne multimédia.
Ce mode de mise en œuvre de l’invention permet de réaliser de manière automatisée un enchaînement de séquences issues d'un ou de plusieurs contenus multimédia et relatives à des instants présentant des pics de commentaires, appelés également pics d'audience ou pics d'audience sociale.
Selon un deuxième mode de mise en œuvre particulier de l'invention, qui pourra être mis en œuvre alternativement ou cumulativement avec le précédent, l'étape d'obtention de l'histogramme est réalisée sur la base de mots-clés inclus dans les commentaires en rapport avec le contenu multimédia. L'histogramme est constitué à partir de données reçues d'une plateforme de services. Ces données correspondent, en particulier, aux nombres de commentaires émis en lignes dans des intervalles de temps prédéfinis. Cette représentation graphique de l'audience sociale peut également être complétée par la comptabilisation d'occurrences de mots-clés en rapport avec contenu multimédia considéré, dont la liste de ces mots-clés peut être plus ou moins exhaustive ; par exemple, en plus du nom d'une émission télévisée, peuvent être intégrés les commentaires comprenant le nom de l'animateur, les invités du jour, les thèmes de débats abordés, etc. Un nombre d'occurrences minimal par mot-clé peut être défini comme un seuil pour intégrer cette liste de mots-clés.
Ce mode de mise en œuvre de l’invention permet d'affiner les résultats comptabilisés sur le nombre de commentaires en rapport avec un contenu multimédia donné. Des caractéristiques de l'histogramme, et en particulier les valeurs relatives associés aux intervalles de temps, dépend la pertinence de l'extraction de l'instant présentant un pic de commentaires.
Selon un troisième mode de mise en œuvre particulier de l’invention, qui pourra être mis en œuvre alternativement ou cumulativement avec les précédents, l'étape d'extraction de l'instant prend également en compte le type de contenus multimédia considéré. L'évaluation d'un décalage temporel pour corréler des événements observables sur deux lignes de temps distincts, à savoir une ligne de temps relative à la diffusion d'un programme et une ligne de temps relative à des commentaires en rapport avec ce programme, permet d'approximer l'instant « réel » présentant un pic de commentaires. Par instant extrait, est entendu l'instant associé à un intervalle de temps relatif à un maximum local. Comme on le verra dans la suite de la description, selon le type de contenu considéré, le calcul de cet instant comprend différentes valeurs en paramètre, définies par des études empiriques, en particulier dans les cas de programmes télévisés de type sport ou de type télé-réalité.
Ce mode de mise en œuvre de l'invention permet d'obtenir une donnée temporelle pour l'instant « réel » ou « corrigé » présentant un pic de commentaires, et ainsi, d'obtenir une donnée de référence sur l'instant de diffusion de la séquence à extraire.
Selon un quatrième mode de mise en œuvre particulier de l'invention, qui pourra être mis en œuvre alternativement ou cumulativement avec les précédents, la détermination d'une plage de temps prend également en compte le type de contenus multimédia considéré.
Ce mode de mise en œuvre de l’invention permet d'obtenir une donnée temporelle pour définir la plage de temps relative à la séquence à extraire dans le contenu multimédia. La plage de temps fait référence à la durée de la séquence, ou bien, à l'ensemble des paramètres nécessaires au découpage de la séquence dans le contenu, c'est-à-dire une heure de début de diffusion de la séquence et une durée, ou bien une heure de début et une heure de fin de diffusion de la séquence, ou bien une durée et une heure de fin de diffusion de la séquence.
Selon un cinquième mode de mise en œuvre particulier de l’invention, qui pourra être mis en œuvre alternativement ou cumulativement avec les précédents, la détermination d'une plage de temps prend également en compte les durées des intervalles de temps prédéfinies de l'histogramme. La distribution des intervalles de temps de l'histogramme se détermine en fonction des intervalles de temps choisis par la plateforme du fournisseur de services en ligne pour comptabiliser le nombre de commentaires.
Ce mode de mise en œuvre permet d'évaluer une plage de temps selon les longueurs des intervalles de temps considérés pour l'histogramme, afin d'obtenir un résultat de pertinence élevé sur le choix de la séquence du contenu à extraire. Par exemple, une séquence d'une durée supérieure à la moitié de la longueur de l'intervalle relatif à l'instant extrait, peut posséder plus d'une chance sur deux de contenir le ou les moments du programme télévisé à l'origine du pic de commentaires associé à cet instant.
Selon un sixième mode de mise en œuvre particulier de l’invention, qui pourra être mis en œuvre alternativement ou cumulativement avec les précédents, la plage de temps comprend l'intervalle de temps présentant un pic de commentaires et des intervalles de temps adjacents à cet intervalle.
Ce mode de mise en œuvre permet, à partir d'un paramètre d'ancrage, de définir la localisation de la plage de temps à travers la ligne de temps de la diffusion du contenu. La séquence n'est pas en général incluse en totalité dans l'instant extrait mais peut se prolonger également sur les intervalles de temps adjacents à cet instant, en particulier l'intervalle de temps précédent ou suivant.
Selon une variante de l’invention, qui pourra être mis en œuvre alternativement ou cumulativement avec les cinquième et sixième modes de mise en œuvre de l'invention, les durées prédéfinies des intervalles de temps de l'histogramme sont égales.
Cette variante permet d'appliquer des méthodes de calcul spécifiques aux intervalles de temps de longueur égale, par exemple la méthode des trapèzes. A partir de certaines méthodes, il est possible de rechercher un ensemble de pics de commentaires sur un regroupement de plusieurs intervalles de temps adjacents.
Selon un septième mode de mise en œuvre particulier de l’invention, qui pourra être mis en œuvre alternativement ou cumulativement avec les précédents, l'obtention d'un histogramme d'un nombre de commentaires à partir d'une première source digitale comprend le regroupement des commentaires par des intervalles de temps prédéfinis.
Ce mode de mise en œuvre de l’invention permet d'avoir la flexibilité de construire un histogramme selon une distribution d'intervalles de temps identique ou différente à celle fixée par les données reçues d'un fournisseur de services en ligne. Par exemple, la longueur d'un intervalle de temps peut être prédéfinie, par exemple, comme le regroupement de deux intervalles de temps fixés par la plateforme de service.
Selon une variante de l’invention, qui pourra être mis en œuvre alternativement ou cumulativement avec le septième mode de mise en œuvre de l'invention, une deuxième source digitale présente des intervalles de temps prédéfinis pour les commentaires, le regroupement par des intervalles de temps prédéfinis appliqués à la première source digitale utilisant les intervalles de temps prédéfinis de la deuxième source digitale.
Cette variante permet de combiner plusieurs sources digitales de commentaires émis en ligne pour un même contenu multimédia en regroupant plusieurs lignes de temps selon une distribution d'intervalles unique. Par exemple, une deuxième source peut comptabiliser des commentaires sur des intervalles de temps inclus dans les intervalles de temps déjà constitués par la première source digitale.
Selon une variante de l’invention, qui pourra être mis en œuvre alternativement ou cumulativement avec la variante précédente du septième mode de mise en œuvre de l'invention, l'étape d'obtention d'un histogramme comprend une étape préliminaire de consolidation de l'histogramme de la première source digitale avec l'histogramme de la deuxième source digitale.
Cette variante permet de construire un histogramme unique combinant les données de plusieurs sources digitales de commentaires émis en ligne pour un même contenu multimédia, dont les intervalles de temps relatifs aux nombres de commentaires sont synchronisés ou non. Par exemple le fil d'actualité Facebook présentes des commentaires sur une ligne de temps. Une phase de regroupement du nombre de commentaires Facebook selon les intervalles de temps prédéfinis pour le service Twitter, permet de bénéficier avantageusement des données issues de ces deux plateformes de services. L'histogramme unique ainsi généré, regroupe les utilisateurs de plusieurs services en ligne afin d'évaluer une audience sociale de manière plus exhaustive.
Selon un aspect matériel, l'invention concerne également un dispositif de sélection apte à sélectionner au moins une séquence d'un contenu multimédia à partir de commentaires d'utilisateurs, en rapport avec le contenu, émis en ligne sur une source digitale d'un type donné, comprenant un processeur configuré pour : - obtenir sur au moins une partie de la durée d'un contenu multimédia, un histogramme du nombre de commentaires, les commentaires étant distribués sur des intervalles de temps prédéfinis, - extraire, à partir de l'histogramme, l'instant associé à un intervalle de temps présentant un pic de commentaires, - déterminer une plage de temps fonction de l'instant extrait, - extraire, du contenu multimédia, une séquence correspondant à ladite plage de temps.
Selon un autre aspect matériel, l’invention concerne également un programme d’ordinateur apte à être mis en œuvre sur un dispositif tel que défini ci-dessus, le programme comprenant des instructions de code qui, lorsque le programme est exécuté par un processeur, réalise les étapes du procédé défini ci-dessus.
Un tel programme peut utiliser n'importe quel langage de programmation. Il peut être téléchargé depuis un réseau de communication et/ou enregistré sur un support lisible par ordinateur. L’invention sera mieux comprise à la lecture de la description qui suit, donnée à titre d’exemple et faite en référence aux dessins annexés sur lesquels :
La figure 1 représente un système informatique sur lequel est illustré un exemple de réalisation de l'invention. Sur cette figure apparaissent également les étapes d'un mode de réalisation du procédé de l'invention.
La figure 2 illustre les étapes du programme que réalise le procédé de sélection d'une séquence de contenu multimédia mis en œuvre par le dispositif de sélection.
La figure 3 illustre l'instant associé à un intervalle de temps présentant un pic de commentaires. La représentation graphique sous forme d'un histogramme du nombre de commentaires émis et comptabilisés sur trois intervalles de temps adjacents permet d'observer un maximum local.
Description détaillée d'exemples de réalisation illustrant l'invention
La figure 1 représente un système SYS comprenant un dispositif de sélection DS. Ce dispositif DS a l'architecture matérielle d'un ordinateur conventionnel. Il comporte notamment un processeur, une mémoire vive de type RAM et une mémoire morte dans laquelle est enregistré un programme d'ordinateur conforme à l'invention, ce programme comportant des instructions pour exécuter les étapes du procédé dont l'organigramme est donné à la figure 2.
Le système SYS comprend aussi un dispositif de traitement de données PA. Plus spécifiquement, ce dispositif réceptionne et stocke au fur et à mesure des séquences de contenus multimédia, reçues du dispositif DS ou directement du dispositif CM. Ce dispositif possède également la possibilité de réaliser un traitement informatique sur les séquences reçues, en particulier leur assemblage sous forme de chaînes de contenus multimédia, et intègre la possibilité de mettre à disposition ces chaînes constituées.
Les dispositifs DS et PA peuvent communiquer entre eux ; en particulier, le dispositif DS transfère des données vers le dispositif PA. La composition des deux dispositifs DS et PA est référencée 120 sur la figure 1.
Le système SYS comprend aussi un dispositif de traitement de données CM. Plus spécifiquement, ce dispositif enregistre et stocke des contenus multimédia précédemment diffusés en mode groupe sur un ou plusieurs réseaux. Par diffusion en mode groupe, est entendue l'émission de contenus multimédia par une source, en particulier professionnelle, vers un public de spectateurs. Les spectateurs possèdent en général des droits d'accès à ces contenus et des équipements adaptés à leur visualisation, tel un ordinateur, une télévision, un poste de radio... Les termes « en temps réel », « streaming », « broadcast » sont des termes parfois utilisés pour relater ce type de diffusion de flux de données issus de plateformes de services. Pour la mise en œuvre de l'invention, ce mode de diffusion permet de synchroniser les données temporelles entre le ou les réseaux de diffusion d'un contenu multimédia, et la ou les plateformes de services recevant les commentaires émis en ligne par les spectateurs. Les termes utilisateur, spectateur ou téléspectateur, sont utilisés indifféremment.
Le système SYS comprend aussi un dispositif TWT représentatif d'une plateforme hébergeant une source digitale des commentaires émis en ligne. Par commentaire, est entendu un message émis par un utilisateur vers la plateforme TWT. Ce commentaire peut être de différentes natures, en particulier sous forme de données textuelles.
Pour simplifier l'exposé, les trois dispositifs CM, PA et TWT seront illustrés au moyen de trois serveurs, respectivement.
De façon connue en soi, les dispositifs et les serveurs ont l’architecture matérielle d’un ordinateur c'est-à-dire comportant des ressources pour le traitement de données, à savoir au moins un processeur, une mémoire morte, une mémoire vive et des moyens de communication.
La figure 2 illustre le procédé de sélection d'une séquence de contenu multimédia par le dispositif de sélection.
La première étape 210 est définie par l'obtention d'un histogramme à partir des données récupérées de la plateforme TWT. Par histogramme, est entendue la représentation graphique d'une série de données numériques dont on comptabilise le nombre de données sur chaque intervalle constitué sur une composante continue. Ces intervalles sont adjacents, et, par exemple, de longueur fixe, et ils caractérisent un histogramme. Par exemple, le service en ligne Twitter publie le paramètre « nombre de commentaires » selon des intervalles de temps prédéfinis qui sont de l'ordre de la minute. Sur un histogramme, les commentaires comptabilisés durant un intervalle de temps d'une minute, sont regroupés pour être associés par leur nombre à une donnée ponctuelle, représentée et dénommée comme un « instant ».
La deuxième étape 220 est définie par l'extraction d'un instant présentant un pic de commentaires. Sur l'histogramme, cet instant représente un intervalle de temps associé à une valeur locale maximale de commentaires. Le procédé calcule une approximation de l'instant « réel » de ce pic de commentaires, l'instant extrait. En effet, pour la mise en œuvre d'une sélection automatisée de séquences d'un programme télévisé selon l'audience sociale, il est nécessaire de réussir à corréler la ligne de temps de la diffusion d'un programme avec la ligne de temps relative aux commentaires en rapport avec ce programme. Bien qu'un événement d'un programme génère de nombreux commentaires qui vont être autant de marqueurs pour identifier la séquence à sélectionner, l'évaluation du décalage temporel entre la diffusion de cet événement et la prise en compte des commentaires relatifs à cet événement, est nécessaire ; ce que résout le procédé.
La troisième étape 230 est définie par la détermination de la plage de temps fonction de l'instant extrait. Il peut exister des décalages temporels incompressibles dus au temps de transmission des contenus à travers les différents réseaux de diffusion et au temps de réaction des spectateurs. Ainsi, des paramètres spécifiques ont été évalués et fixés pour le procédé selon des résultats d'études empiriques afin de définir la plage de temps nécessaire à la caractérisation de la sélection. Cette plage de temps est fonction de l'instant extrait, d'un paramètre d'ancrage et de la durée de la séquence. Par paramètre d'ancrage, est entendu le paramètre permettant de positionner l'heure de début de la diffusion de la séquence en fonction de l'instant extrait. Par exemple, un paramètre d'ancrage fixé à 0,5 correspond à une plage de temps dont l'instant extrait se positionne à la moitié de la séquence à extraire. Une approche statistiquement efficace permet de fixer une durée de la séquence selon le type de programmes télévisés, et ainsi, de sélectionner une séquence avec un résultat de pertinence élevé.
La quatrième et dernière étape 240 est définie par la demande d'extraction par le dispositif DS de la séquence du contenu par le dispositif CM, et à destination du dispositif PA.
La figure 3 illustre l'instant « réel » présentant un pic de commentaires, noté t*, évalué lors de l'étape 220 du procédé de sélection illustrée à la figure 2. Dans notre exemple, lors de l'analyse de l'histogramme de l'audience sociale sur les trois intervalles de temps des instants T-l, T et T+l, un maximum local est constaté : le nombre de commentaires nbT, correspondant à la donnée temporelle T, est caractérisé par le fait que ce nombre est plus important que les nombres de commentaires reçus à T-l et T+l. A noter que, dans notre exemple, l'instant T fait référence à l'instant de fin de l'intervalle de temps correspondant : les commentaires illustrés à l'instant T sur l'histogramme sont émis entre les instants T-l et T. Ainsi, l'instant extrait t* se trouve donc, dans ce cas-là, entre les instants T-l et T. D'autres caractéristiques peuvent s'ajouter afin d'affiner la caractérisation d'un maximum local de l'histogramme à l'instant T. La prise en compte ou non de ces nouvelles caractéristiques entraîne la poursuite ou l'arrêt du procédé extraction de la séquence pour s'ajouter à une chaîne multimédia ; par exemple, la valeur absolue du nombre de commentaires à l'instant T, les valeurs absolues ou relatives du nombre de commentaires aux instants T-l ou antérieurs à l'instant T-l, et/ou aux instants T+l ou postérieurs à l'instant T+l, etc.
Sur la figure 1, déjà introduite précédemment, plusieurs étapes référencées et numérotées de el à e5 illustrent un mode de réalisation du procédé de l'invention. Sur cette figure, une étape eN mettant en œuvre un échange de données est symbolisée par une flèche ayant une origine et une extrémité, l’origine étant associée à l’émetteur d’un message, l’extrémité étant associée au destinataire du message. Aussi, les étapes ne mettant pas en œuvre une communication mais un traitement interne sont référencées dans le dispositif concerné par le traitement ; ces étapes sont les étapes progl et prog2.
Le contenu multimédia considéré par l'invention est un contenu diffusé en mode groupe vers un public de spectateurs qui visualisent le contenu sur une même ligne de temps. La diffusion des flux ininterrompus de programmes émis en temps réel par les différentes chaînes de télévision, à travers un réseau hertzien, numérique ou à travers le réseau internet, est particulièrement adaptée pour la mise en œuvre du procédé de sélection. Les chaînes diffusées uniquement sur le réseau internet, de type web TV, en est en autre exemple. Les services de type « vidéos à la demande » sont potentiellement des services également à considérer pour la mise en œuvre du procédé de sélection : un groupe de spectateurs qui se rejoignent virtuellement pour lancer et lire une vidéo sur une même ligne de temps, est également un exemple de contexte d'application. Pour réaliser la dernière étape du procédé de sélection, il existe des plateformes, illustrées par la plateforme CM, qui enregistrent en continu tous les contenus diffusés sur les chaînes de télévision, en référençant le ou les différentes heures de diffusion de ceux-ci.
Selon un premier mode de réalisation, les étapes de sélection d'une séquence de contenu multimédia et de création d'une chaîne multimédia de manière automatisée par l'ensemble 120 comprennent les six étapes suivantes (el, e2, progl, e3, e4, prog2) :
Lors d'une première étape el, le dispositif 120 envoie une requête à la plateforme TWT grâce aux modules d'interfaçage mis en place par la plateforme TWT pour dialoguer avec d'autres plateformes. Par requête, est entendue une demande-réponse entre le dispositif DS et la plateforme TWT : le dispositif DS interroge la plateforme TWT pour obtenir une information, information que lui retourne cette dernière par une réponse. A noter que cette étape el est optionnelle ; la plateforme TWT pouvant être conçue pour émettre à des instants prédéfinis, par exemple périodiquement, des données au dispositif DS.
Lors d'une deuxième étape e2, le dispositif 120 reçoit la réponse à sa requête et traite l'information.
Lors d'une troisième étape, le dispositif DS calcule grâce à un premier programme d'ordinateur progl, une plage de temps et envoie dans une quatrième étape e3 les instructions d'extraction relatives à cette plage de temps à la plateforme CM.
Après une cinquième étape de réception e4 de la séquence du contenu multimédia par le dispositif PA, ce dernier traite dans une sixième étape la demande d'assemblage de la séquence avec une ou plusieurs chaînes multimédia, si besoin, grâce à un deuxième programme d'ordinateur prog2.
La demande-réponse (el, e2) à la plateforme TWT peut être réitérée une ou plusieurs fois afin d'obtenir davantage de données pour l'histogramme, par exemple, à travers la recherche de commentaires supplémentaires comprenant d'autres mots-clés.
Une étape de traitement de données de la séquence du contenu multimédia par le dispositif PA met à jour une chaîne multimédia en cours de réalisation. A la réception de la séquence, le dispositif PA recherche dans les données, jointes à la séquence ou envoyées par le dispositif DS, le traitement attendu pour cette séquence. En cas de demande d'assemblage de la séquence avec une chaîne multimédia, déjà existante ou à initialiser, le dispositif assemble la séquence.
Selon un deuxième mode de réalisation, les étapes el et e2, définies précédemment, se décomposent en deux requêtes suivantes.
Lors d'une première requête, le dispositif DS interroge la plateforme TWT sur l'audience sociale d'un ensemble de flux audio et/ou vidéo diffusés sur une période passée ; par exemple, sur l'ensemble des chaînes de télévision les plus regardées la veille au soir. En réponse, le dispositif DS réceptionne des données sur l'audience sociale des chaînes de la veille au soir.
Lors d'une deuxième requête, selon les chaînes les plus commentées, le dispositif DS interroge la plateforme TWT sur les émissions les plus commentées. En retour, le dispositif DS réceptionne des données sur l'audience sociale des émissions les plus commentées la veille au soir.
Il va de soi que ce mode de réalisation qui a été décrit ci-dessus a été donné à titre purement indicatif et nullement limitatif, et que le nombre et la nature des requêtes qui peuvent être effectués sont à l'appréciation de l'homme du métier.
Selon un troisième mode de réalisation, l'instant extrait, noté t*, se calcule d'après notre exemple selon les données de trois intervalles de temps adjacents et de longueur égale : en fonction de l'instant T, des nombres de commentaires nb_T, nb_T-l et nb_T+l relatifs aux instants T, T-l et T+l, ainsi que d'une constante k. Cette constante k est une donnée numérique qui est fixée selon le type d'émission considéré. De manière succincte, t* est fonction des paramètres suivants : t* fonction ((nb_T), (nb_T-l), (nb_T+l), T, k)
Plus explicitement, en se servant de la méthode des trapèzes et en approximant t* au second ordre et au voisinage du maximum de la courbe illustrée à la figure 3, alors on obtient la formule suivante : t* = T- (k+ 60 * (0,5 + ((nb_T+l)-(nb_T-l))/((nb_T+l)+(nb_T-l)-2*(nb_T))))
En particulier, pour les émissions de type sport, le paramètre k est fixé expérimentalement, par exemple, à 40 secondes. Pour d'autres émissions, le paramètre k est fixé expérimentalement, par exemple, à 20 secondes.
Selon un quatrième mode de réalisation, dans le cas du fournisseur de services Twitter où les intervalles de temps sont de l'ordre d'une minute, pour une séquence d'émissions de type télé-réalité, la durée moyenne de la séquence considérée est de 40 secondes. Pour un extrait d'émissions de type sport, la durée moyenne de la séquence considérée est de 30 secondes. Ces durées moyennes ont été obtenues à travers des études empiriques réalisées sur différents types de contenus : ces deux types de contenus obtiennent des résultats de pertinence élevés pour la sélection de séquences ; ce qui n'est pas le cas pour des contenus de type films ou séries, pour lesquels les pics de commentaires ne semblent pas répondre aux mêmes caractéristiques d'audience sociale.
Selon un cinquième mode de réalisation, la longueur des intervalles de temps prédéfinis de l'histogramme détermine en grande partie la durée moyenne de la plage de temps de la séquence. En effet, dans le cas considéré ci-dessus d'une longueur d'intervalle d'une minute, la probabilité de sélectionner l'instant à l'origine d'un pic de commentaires dans une séquence d'en moyenne 30 secondes, est en moyenne d'une chance sur deux.
Selon un sixième mode de réalisation, la plage de temps pour la séquence du contenu multimédia SL est fonction du flux de données diffusé en mode groupe, de l'instant présentant un pic de commentaires et d'une plage de temps notée d. SL «-fonction (flux, t*, d)
Si on note A(T(i)) le nombre de commentaires cumulés entre T(i) et T(i+1), le procédé associe à la suite A(T(i)), A(T(i+l)),..., A(T(i+j)), la suite des pics d'audience (T*l, 1*2, ...) sur le regroupement d'intervalles de temps [T(i), T(i+j)]. Les intervalles de temps prédéfinis ne sont pas nécessairement équidistants. Plusieurs instants présentant un pic de commentaires sur un regroupement d'intervalles de temps prédéfinis sur l'histogramme peuvent être recherchés, et donc plusieurs plage de temps recherchées sur cet intervalle [T(i), T(i+j)].
Il existe plusieurs méthodes d'approximation applicables : la méthode des trapèzes, la méthode des paraboles, la méthode d'Akima, etc.
Selon une variante des cinquième et sixième modes de réalisation, pour la méthode des trapèzes donnée à titre d'exemple, est recherché dans un regroupement de trois intervalles (j = 2), un seul instant présentant un pic de commentaires.
La distribution d'intervalles de temps peut être identique ou différente à celle de la plateforme de services interrogée par le dispositif DS, en particulier si des intervalles de temps sont souhaités de longueur égale.
Selon un septième mode de réalisation, le procédé comptabilise les commentaires d'un service en ligne selon des intervalles de temps prédéfinis. En particulier, si la publication des commentaires est notifiée selon l'heure d'envoi du commentaire à la plateforme de service, le procédé peut comptabiliser les nombres de commentaires par intervalles de temps prédéfinis.
Selon une variante du septième mode de réalisation, dans une première étape d'une phase préliminaire, le procédé adapte les intervalles de temps des relevés d'audience sociale d'un premier fournisseur de services, aux relevés d'audience sociale d'un deuxième fournisseur de services relatifs à un même contenu multimédia ; en particulier si la distribution des intervalles de temps, par regroupement d'intervalles du premier par le deuxième, ou inversement, est possible. Dans le cas contraire, si la distribution des intervalles de temps du deuxième fournisseur de services n'est pas directement adaptable aux intervalles de temps du premier fournisseur, un fractionnement des intervalles de temps est réalisé de manière à définir des intervalles de temps identiques entre les deux fournisseurs de service.
Selon une variante de la variante précédente du septième mode de réalisation, dans une deuxième étape de la phase préliminaire, le procédé fusionne les données issues des deux fournisseurs de services dans un même histogramme, grâce aux intervalles de temps résultant d'un fractionnement d'intervalles si besoin.
Il va de soi que le mode de réalisation qui a été décrit ci-dessus a été donné à titre purement indicatif et nullement limitatif, et que de nombreuses modifications peuvent être facilement apportées par l'homme de l'art sans pour autant sortir du cadre de l'invention.

Claims (13)

  1. Revendications
    1. Procédé de sélection d'au moins une séquence d'un contenu multimédia à partir de commentaires d'utilisateurs, en rapport avec le contenu, émis en ligne sur une source digitale d'un type donné, le procédé comprenant les étapes suivantes : - obtention sur au moins une partie de la durée d'un contenu multimédia, d'un histogramme du nombre de commentaires, les commentaires étant distribués sur des intervalles de temps prédéfinis, - extraction, à partir de l'histogramme, de l'instant associé à un intervalle de temps présentant un pic de commentaires, - détermination d'une plage de temps fonction de l'instant extrait, - extraction, du contenu multimédia, d'une séquence correspondant à ladite plage de temps.
  2. 2. Procédé de sélection conforme à la revendication 1, dans lequel la sélection concerne une pluralité de séquences, et dans lequel les séquences sont assemblées pour former une chaîne multimédia.
  3. 3. Procédé de sélection conforme à l'une des revendications précédentes, dans lequel l'étape d'obtention de l'histogramme est réalisée sur la base de mots-clés inclus dans des commentaires en rapport avec le contenu multimédia.
  4. 4. Procédé de sélection conforme à l'une des revendications précédentes, dans lequel l'étape d'extraction de l'instant prend également en compte le type de contenus multimédia considéré.
  5. 5. Procédé de sélection conforme à l'une des revendications précédentes, dans lequel la détermination d'une plage de temps prend également en compte le type de contenus multimédia considéré.
  6. 6. Procédé de sélection conforme à l'une des revendications précédentes, dans lequel la détermination d'une plage de temps prend également en compte les durées des intervalles de temps prédéfinis de l'histogramme.
  7. 7. Procédé de sélection conforme à l'une des revendications précédentes, dans lequel la plage de temps comprend l'intervalle de temps présentant un pic de commentaires et des intervalles de temps adjacents à cet intervalle.
  8. 8. Procédé de sélection conforme à l'une des revendications 6 et 7, dans lequel les durées prédéfinies des intervalles de temps de l'histogramme sont égales.
  9. 9. Procédé de sélection conforme à l'une des revendications précédentes, dans lequel l'obtention d'un histogramme d'un nombre de commentaires à partir d'une première source digitale comprend le regroupement des commentaires par des intervalles de temps prédéfinis.
  10. 10. Procédé de sélection conforme à la revendication 9, dans lequel une deuxième source digitale présente des intervalles de temps prédéfinis pour les commentaires, le regroupement par des intervalles de temps prédéfinis appliqués à la première source digitale utilisant les intervalles de temps prédéfinis de la deuxième source digitale.
  11. 11. Procédé de sélection conforme à la revendication 10, dans lequel l'étape d'obtention d'un histogramme comprend une étape préliminaire de consolidation de l'histogramme de la première source digitale avec l'histogramme de la deuxième source digitale.
  12. 12. Dispositif de sélection (DS) apte à sélectionner au moins une séquence d'un contenu multimédia à partir de commentaires d'utilisateurs, en rapport avec le contenu, émis en ligne sur une source digitale d'un type donné, comprenant un processeur configuré pour : - obtenir sur au moins une partie de la durée d'un contenu multimédia, un histogramme du nombre de commentaires, les commentaires étant distribués sur des intervalles de temps prédéfinis, - extraire, à partir de l'histogramme, l'instant associé à un intervalle de temps présentant un pic de commentaires, - déterminer une plage de temps fonction de l'instant extrait, - extraire, du contenu multimédia, une séquence correspondant à ladite plage de temps.
  13. 13. Programme d’ordinateur apte à être mis en œuvre sur un dispositif (DS) tel que défini dans la revendication 12, le programme comprenant des instructions de code qui, lorsqu'il est exécuté par un processeur, réalise les étapes du procédé définies dans la revendication 1.
FR1656237A 2016-06-30 2016-06-30 Procede de selection d'au moins une sequence d'un contenu multimedia basee sur l'audience sociale Pending FR3047097A1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR1656237A FR3047097A1 (fr) 2016-06-30 2016-06-30 Procede de selection d'au moins une sequence d'un contenu multimedia basee sur l'audience sociale

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR1656237A FR3047097A1 (fr) 2016-06-30 2016-06-30 Procede de selection d'au moins une sequence d'un contenu multimedia basee sur l'audience sociale

Publications (1)

Publication Number Publication Date
FR3047097A1 true FR3047097A1 (fr) 2017-07-28

Family

ID=56943737

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1656237A Pending FR3047097A1 (fr) 2016-06-30 2016-06-30 Procede de selection d'au moins une sequence d'un contenu multimedia basee sur l'audience sociale

Country Status (1)

Country Link
FR (1) FR3047097A1 (fr)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015101385A1 (fr) * 2013-12-30 2015-07-09 Telecom Italia S.P.A. Procédé et système pour sélectionner automatiquement des parties d'un contenu multimédia vidéo et/ou audio sur la base d'informations obtenues à partir de réseaux sociaux

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015101385A1 (fr) * 2013-12-30 2015-07-09 Telecom Italia S.P.A. Procédé et système pour sélectionner automatiquement des parties d'un contenu multimédia vidéo et/ou audio sur la base d'informations obtenues à partir de réseaux sociaux

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ADAM MARCUS ET AL: "Twitinfo", CHI 2011, 7 May 2011 (2011-05-07), pages 227, XP055044158, ISBN: 978-1-45-030228-9, DOI: 10.1145/1978942.1978975 *
ANTHONY TANG ET AL: "#EpicPlay: Crowd-sourcing Sports Video Highlights", PROCEEDINGS OF THE 2012 ACM ANNUAL CONFERENCE ON HUMAN FACTORS IN COMPUTING SYSTEMS, CHI '12, 5 May 2012 (2012-05-05), New York, New York, USA, pages 1569 - 1572, XP055347838, ISBN: 978-1-4503-1015-4, DOI: 10.1145/2207676.2208622 *
JOHN HANNON ET AL: "Personalized and automatic social summarization of events in video", PROCEEDINGS OF THE 15TH INTERNATIONAL CONFERENCE ON INTELLIGENT USER INTERFACES, IUI '11, 13 February 2011 (2011-02-13), New York, New York, USA, pages 335 - 338, XP055347832, ISBN: 978-1-4503-0419-1, DOI: 10.1145/1943403.1943459 *
MASAMI NAKAZAWA ET AL: "Social Indexing of TV Programs: Detection and Labeling of Significant TV Scenes by Twitter Analysis", ADVANCED INFORMATION NETWORKING AND APPLICATIONS WORKSHOPS (WAINA), 2012 26TH INTERNATIONAL CONFERENCE ON, IEEE, 26 March 2012 (2012-03-26), pages 141 - 146, XP032169774, ISBN: 978-1-4673-0867-0, DOI: 10.1109/WAINA.2012.188 *

Similar Documents

Publication Publication Date Title
EP2731347B1 (fr) Crowdsourcing de contenus supplémentaires
KR101371574B1 (ko) 매스 미디어를 위한 사회적 및 상호작용 애플리케이션
CN104798346B (zh) 用于补充与广播媒体相关的电子消息的方法和计算系统
EP2811749B1 (fr) Synchronisation de contenus multimédia sur deuxième écran
US11188603B2 (en) Annotation of videos using aggregated user session data
US8396874B2 (en) System and method for using topic messages to understand media relating to an event
EP2817775B1 (fr) Procede de mesure d'audience
AU2011376198B2 (en) Method for capturing video related content
EP2200258B1 (fr) Procédé de distribution d'un contenu vers un utilisateur
CN107004210A (zh) 用于识别观看电视广告的用户的系统和方法
US20160330526A1 (en) Method and System for Automatically Selecting Parts of a Video and/or Audio Media Content Based on Information Obtained from Social Networks
FR3047097A1 (fr) Procede de selection d'au moins une sequence d'un contenu multimedia basee sur l'audience sociale
EP2085894A1 (fr) Procédé de génération de donnés permettant la recherche de compléments de contenus, système et serveur pour la mise en oeuvre du procédé
WO2001091462A1 (fr) Dispositif et procede de synchronisation de programmes audiovisuels diffuses et d'informations complementaires
WO2017064400A1 (fr) Enrichissement contextuel par reconnaissance audio
EP2081383A2 (fr) Procédé de préparation de contenus de programmes audiovisuels, et système associé
EP2362607B1 (fr) Procédé de distribution d'un contenu vers un utilisateur
FR2956787A1 (fr) Procede et serveur pour detecter un programme video recu par un usager
Oliveira et al. From Live TV Events to Twitter Status Updates-a Study on Delays
FR2927716A1 (fr) Procede pour obtenir des informations relatives a des consultations de contenus et equipements associes
FR3035530A1 (fr) Identification des locuteurs d'un contenu multimedia par l'analyse conjointe de donnees audio et de donnees de sous-titres
FR3006542A1 (fr) Programmation d'enregistrement de contenus audiovisuels presents dans une grille de programmes electronique
FR2961645A1 (fr) Dispositif et procede de differenciation des caracteristiques par reconnaissance de modeles
EP2400753A1 (fr) Obtention d'informations complémentaires associées à un contenu diffusé
FR3041852A1 (fr) Procede et dispositif d'enrichissement d'une fonction pause de la lecture d'une sequence d'images

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 2

PLSC Publication of the preliminary search report

Effective date: 20170728