WO2007099050A1

WO2007099050A1 - Procede d'affichage d'informations extraites d'un document compose de reportages et recepteur mettant en œuvre le procede

Info

Publication number: WO2007099050A1
Application number: PCT/EP2007/051650
Authority: WO
Inventors: Claire-Hélène Demarty; Louis Chevallier; Jean-Ronan Vigouroux
Original assignee: Thomson Licensing
Priority date: 2006-03-03
Filing date: 2007-02-21
Publication date: 2007-09-07
Also published as: FR2898235A1

Abstract

L'invention concerne un procédé d'affichage d'image extraites d'un document audiovisuel enregistré dans un appareil. Le document enregistré comporte au moins un reportage comprenant au début une première séquence vidéo présentant une caractéristique particulière, tel que l'image d'un présentateur. Cette première séquence vidéo ne comportant qu'un contenu informatif limité, l'invention consiste à sélectionner au moins une image extraite du reportage mais pas de la première séquence vidéo, et à créer et afficher une image composite comportant à la fois la première séquence vidéo avec le présentateur et une au moins image extraite du reportage. Un perfectionnement consiste en ce que cette première séquence vidéo provient d'un sommaire du document, des images du reportage sont rajoutées aux images du sommaire pour en augmenter le contenu informatif. L'invention concerne également le récepteur apte à mettre en oevre le procédé.

Description

PROCEDE D ^λ AFFICHAGE D ' INFORMATIONS EXTRAITES D ¹ UN DOCUMENT COMPOSE DE REPORTAGES ET RECEPTEUR METTANT EN OEUVRE LE PROCEDE

DOMAINE TECHNIQUE DE L'INVENTION

L'invention concerne un procédé d'affichage d'informations extraites d'un document enregistré composé de reportages, et un récepteur mettant en œuvre le procédé.

ETAT ANTERIEUR DE L'INVENTION

De nos jours, de nombreux appareils permettent la réception et la reproduction d'œuvres audiovisuelles enregistrées. Récemment, des disques durs de grande capacité ont été intégrés à ces récepteurs audiovisuels ; on peut y stocker des contenus téléchargés soit d'un réseau de diffusion unidirectionnel, soit d'un réseau point à point (Internet par exemple). Parmi ces appareils, les PVR (acronyme de Personal Video Recorder) sont généralement dotés d'un Guide Electronique de Programme (EPG en abrégé) qui permet à un utilisateur d'afficher les contenus enregistrés dans le disque dur et de les reproduire à l'aide d'une commande. Aujourd'hui, la taille des disques durs permet de stocker plus de 200 heures de programmes. Cette quantité d'information disponible nécessite l'ajout de nouvelles fonctionnalités dans les PVR permettant une navigation inter et intra rapide. L'EPG permet de regrouper les documents selon de nombreux critères et de les présenter par groupes, par exemple : le thème, le type, la langue, le contrôle parental, etc. La classification s'effectue à l'aide de métadonnées associées au contenu audiovisuel. Selon une variante, le récepteur analyse le contenu et est capable de le classifier. Un autre exemple de moyen de stockage concerne les magnétoscopes qui enregistrent les œuvres audiovisuelles sur des bandes magnétiques. Dans ce cas, l'accès au contenu audiovisuel est séquentiel. Sur ces produits, il est possible, soit d'enregistrer immédiatement la vidéo en cours de réception sur le canal courant, soit de programmer l'enregistrement d'un événement diffusé ultérieurement. Quelle que soit la façon de mémoriser le contenu, l'interface utilisateur permet de contrôler la sélection et la reproduction des documents enregistrés. Dans un premier temps, l'utilisateur sélectionne à l'aide d'un guide de programmes l'émission qu'il désire visualiser. Puis, en appuyant sur la touche « lecture » il déclenche la visualisation de l'œuvre.

Dans le cas d'enregistrements numériques (par exemple : un DVD), l'œuvre est segmentée en plusieurs chapitres. De cette façon, l'utilisateur peut choisir un chapitre et commencer la visualisation au début du chapitre sélectionné. En appuyant sur la touche « Plage suivante » la visualisation saute au segment suivant. Certaines émissions reçues par un réseau de diffusion sont également segmentées, de sorte que, une fois enregistrées dans le disque dur du récepteur, l'utilisateur peut sélectionner un segment précis pour le visualiser ou naviguer d'un segment à un autre en ne visualisant que les premières secondes pour rechercher le segment désiré. Si l'émission est reçue non segmentée, il existe des procédés de segmentation permettant de le faire au niveau du récepteur. La demande de brevet référencée FR02.13977 déposée en France le 28 octobre 2002 décrit un procédé de segmentation qui exploite le contenu audiovisuel de l'œuvre pour en extraire des parties ayant une unité sémantique. Le procédé décrit dans cette demande incluse par référence à la présente demande, permet d'élaborer une segmentation de vidéos de sport selon plusieurs niveaux. Il existe également des procédés permettant d'extraire de manière automatique la structure arborescente d'un film ou d'une vidéo documentaire. Classiquement, la vidéo est découpée en plans en se basant sur des changements abrupts du contenu colorimétrique des images. Puis, les plans sont regroupés en scènes en se basant sur la ressemblance visuelle des contenus des plans et leur proximité temporelle. Lorsque le document enregistré est un journal télévisé, l'indexation selon les procédés actuels va permettre d'accéder directement aux reportages. Lorsqu'un utilisateur sélectionne un reportage, celui-ci est extrait de la mémoire de son appareil et envoyé à l'écran. Les reportages débutent visuellement par un gros plan sur le présentateur du journal. Si le message sonore qui l'accompagne est important car il introduit le reportage, l'image ne donne aucune information pertinente et ne permet pas à l'utilisateur de distinguer un reportage d'un autre, ni d'en avoir une vue d'ensemble, de sorte que l'utilisateur a connaissance du reportage que par sa perception auditive. Une façon de raccourcir ce temps consisterait à couper la séquence introductive du reportage où le présentateur est seul à l'écran et de débuter directement par les images du reportage. Mais cette technique a deux inconvénients : le message sonore introductif et informatif est perdu, et aucune représentation complète du reportage n'est finalement affichée.

Le document US 2004/0197088 publié le 7 octobre 2004 décrit un système pour découper un document en une pluralité de parties, par exemple correspondant à la structure d'un match de football . La structure du document est présentée à l'écran avec des imageries (en Anglais : « thuringiens ») associées aux parties du document. Des documents, par exemple des séquences publicitaires, sont téléchargés de l'extérieur de l'appareil et visualisés à la suite du contenu vidéo et non au même moment, ce qui rallonge le temps de visualisation du document complet. L'utilisateur peut sélectionner les séquences téléchargées pour par exemple commander les objets visualisés De ce fait, ce système nécessite une communication extérieure pour télécharger les séquences audiovisuelles qui sont rajoutées au document. Le document US 6 404 925 publié le 11 juin 2002 décrit une méthode pour segmenter des documents audiovisuels. Ces segments servent d'index pour accéder à des documents enregistrés. L'indexation s'effectue en analysant le signal audio et en identifiant la personne qui parle. On peut ainsi définir des groupes de segments audiovisuels présentant la même personne qui parle. RESUME DE L'INVENTION

La présente invention propose une interface originale de représentation d'un reportage qui conserve la structure et les éléments du reportage et qui permet d'informer plus rapidement l'utilisateur de l'objet du reportage.

L'invention a pour objet un procédé de création d'un nouveau document audiovisuel à partir d'un document audiovisuel enregistré dans un appareil, le document enregistré comportant une séquence vidéo présentant une caractéristique particulière, tel que l'image d'un présentateur ; caractérisé en ce qu'il comporte les étapes suivantes :

- création d'une séquence vidéo composite composée des images extraites de la séquence vidéo enregistrée combinées à au moins une image extraite du document à un moment n'appartenant pas à la séquence vidéo enregistré. De cette façon, le message sonore délivré par le présentateur est toujours présent mais son image associée ne monopolise plus l'écran, car celui-ci est enrichi de parties visuelles du reportage. L 'enrichissement du contenu visuel de la séquence vidéo enregistré par l'insertion d'images extraites du document à un moment n'appartenant pas à cette séquence vidéo permet de ne pas rallonger la durée du document.

Selon un premier perfectionnement, les reportages commencent par un sommaire comportant plusieurs premières séquences vidéo affichant le présentateur. Le procédé consiste alors à découper le document enregistré en plusieurs reportages, à découper le sommaire en parties annonçant un reportage, chaque partie de sommaire étant ainsi associé à un reportage et enfin, à afficher la séquence vidéo composite en affichant en même temps une partie du sommaire et une image précédemment sélectionnée dans le reportage associé à cette partie de sommaire. De cette façon, l'utilisateur peut visualiser le sommaire d'un journal en ayant à l'écran aussi des images clef des reportages annoncés dans ce sommaire. Selon un perfectionnement, l'utilisateur peut naviguer dans le sommaire et notamment déclencher la visualisation plein écran du reportage associé

Selon un autre perfectionnement, le document comportant plusieurs reportages, l'utilisateur peut interrompre l'affichage de la séquence vidéo composite ce qui déclenche une nouvelle étape d'affichage de la séquence vidéo composite correspondant au reportage suivant. De cette façon, l'utilisateur peut rapidement atteindre un reportage qui l'intéresse.

Selon un autre perfectionnement, l'utilisateur peut sélectionner une image sélectionnée comme étant une image clef du reportage, ce qui déclenche la visualisation du plan séquence contenant cette image clef. De cette façon, l'utilisateur peut rapidement atteindre une partie du reportage dont l'image clef a retenu son attention.

Selon un autre perfectionnement, l'affichage d'une séquence vidéo composite dure une durée déterminée au début de chaque première séquence vidéo. Selon un autre perfectionnement, l'étape de sélection d'une image au moins du reportage consiste à sélectionner une image médiane dans un plan séquence. Selon un autre perfectionnement, l'étape d'affichage d'une séquence vidéo composite consiste également à afficher des informations textuelles diffusées dans des informations de services. Selon un autre perfectionnement, l'étape d'affichage d'une séquence vidéo composite consiste également à afficher en association avec chaque image sélectionnée une indication horaire montrant le moment d'apparition de cette image au sein du reportage.

L'invention a également pour objet un récepteur audiovisuel comprenant une unité centrale, un moyen de reproduction d'au moins une partie d'un document audiovisuel enregistré dans un moyen de stockage, le document comportant au moins_une première séquence vidéo présentant une caractéristique particulière, tel que l'image d'un présentateur ; caractérisé en ce qu'il comporte un moyen de création d'une séquence vidéo composite composée des images extraites de la séquence vidéo enregistrée combinées à au moins une image extraite du document à un moment n'appartenant pas à la séquence vidéo enregistrée.

DESCRIPTION DES FIGURES D'autres caractéristiques et avantages de l'invention apparaîtront maintenant avec plus de détails dans le cadre de la description qui suit d'exemples de réalisation donnés à titre illustratif en se référant aux figures annexées qui représentent :

- la figure 1 est un diagramme bloc d'un récepteur audiovisuel pour la mise en œuvre de l'invention,

- la figure 2 est une apparence d'écran montrant le début d'un reportage selon un exemple préféré de réalisation,

- la figure 3 est un organigramme des principales étapes effectuées par le navigateur selon un exemple préféré de réalisation, - la figure 4 est un organigramme des principales étapes effectuées par le navigateur selon une variante de réalisation,

- la figure 5 est une illustration du découpage d'un document enregistré.

DESCRIPTION D'UN MODE DE REALISATION DE L'INVENTION

On décrira tout d'abord le fonctionnement d'un récepteur audiovisuel 1 muni d'un dispositif d'affichage 2. Le récepteur comprend une unité centrale 3 reliée à une mémoire de programme 12, et une interface 5 pour la communication avec un bus numérique local à haut débit 6 permettant de transmettre des données audio/vidéo en temps réel. Ce réseau est par exemple un réseau IEEE 1394. Le récepteur peut également recevoir des données audio/vidéo d'un réseau de diffusion à travers une antenne de réception associée à un démodulateur 4. Le récepteur comprend en outre un récepteur de signaux infrarouges 7 pour recevoir les signaux d'une télécommande 8, une mémoire 9 pour le stockage des données téléchargées, et une logique de décodage audio/vidéo 10 pour la génération des signaux audiovisuels envoyés à l'écran de télévision 2. Selon un exemple de réalisation, la mémoire 9 est un disque dur de grande capacité permettant d'enregistrer des documents audiovisuels. Selon un autre exemple de réalisation, le document audiovisuel est contenu dans un support amovible tel qu'un « compact disk » ou un disque DVD , le support étant inséré dans un périphérique lecteur (non représenté sur la figure 1 ) incorporé dans le récepteur. La télécommande est dotée des touches de direction : 1\ Ψ, -> et <- et des touches de fonction ou de validation telles que : « Sommaire », « OK » et « STOP ». Selon un mode préféré de réalisation, les flèches de direction permettent de déplacer un curseur à l'écran, les commandes accessibles à l'utilisateur sont présentées sous forme d'icônes et sont activées lorsque l'utilisateur appuie sur « OK » avec le curseur positionné sur l'icône correspondant à la commande souhaitée.

Le récepteur comprend également un circuit 11 d'affichage de données sur l'écran, appelé souvent circuit OSD, de l'Anglais "On Screen Display" (signifiant littéralement "affichage sur l'écran"). Le circuit OSD 11 est un générateur de texte et de graphisme qui permet d'afficher à l'écran des menus, des pictogrammes (par exemple, un numéro correspondant à la chaîne visualisée) et qui permet d'afficher les menus de navigation conformément à la présente invention. Le circuit OSD est contrôlé par l'Unité Centrale 3 et un navigateur 12. Le navigateur 12 est avantageusement réalisé sous la forme d'un module de programme enregistré dans une mémoire morte. Il peut aussi être réalisé sous la forme d'un circuit spécialisé de type ASIC par exemple. Le bus numérique 6 et/ou le réseau de diffusion transmettent au récepteur des données comprenant des documents audiovisuels. Eventuellement, ces documents sont associés à des données descriptives. Ces données proviennent soit d'un réseau de diffusion, soit du réseau numérique 6. Les données descriptives comprennent notamment des informations de segmentation définissant les différents segments du document. Avantageusement, les données descriptives permettent une décomposition fine du document et comportent du texte permettant de donner au moins un titre à chaque segment. Les données descriptives sont par exemple contenues dans les informations de service spécifiées par la norme DVB-SI. Elles sont enregistrées dans la mémoire 9 du récepteur.

Après avoir décrit les éléments constituants l'invention selon un exemple préféré de réalisation, nous allons maintenant expliquer comment ceux-ci coopèrent, avec l'aide de la figure 3.

Dans un premier temps, l'utilisateur enregistre le journal télévisé dans la mémoire 9 de son récepteur 1 (étape 3.1 ). L'utilisateur lance ensuite l'exécution de son navigateur résident de son récepteur et demande la visualisation du document enregistré, ce document étant constitué d'au moins un reportage. Classiquement dans un journal télévisé, un reportage commence par une vidéo montrant le présentateur introduisant oralement le sujet qui va être traité. Au niveau visuel, aucune information pertinente n'est fournie. Au niveau sonore au contraire les paroles du présentateur sont essentielles à l'utilisateur pour déterminer le sujet du reportage. A l'étape 3.2, le navigateur sélectionne une ou plusieurs images extraites du corps du reportage. Ces images ne montrant pas le présentateur, leurs contenus visuels sont riches en enseignement. Selon la présente invention, le récepteur 1 va élaborer une nouvelle image 2.1 en redimensionnant l'image du présentateur 2.2 qui apparaît au début du reportage afin de libérer de la place sur l'écran pour afficher d'autres images 2.3, fixes celle-là, extraites à d'autres moments du reportage (étape 3.3). Un exemple de cette nouvelle image 2.1 dite « composite » est représenté par la figure 2. On aperçoit en haut à gauche de l'écran une réduction 2.2 de la vidéo avec le présentateur présent. En partie basse de l'écran, des imagettes 2.3 (« thumbnail » en Anglais) automatiquement extraites du reportage et représentatives de son contenu visuel sont affichées. Dans l'exemple de la figure 2, douze imagettes 2.3 sont affichées qui correspondent à douze moments particuliers du reportage. D'autres dispositions sont également possibles, par exemple le présentateur apparaît au milieu de l'écran sans changement de taille, et les imagettes sont disposées en incrustation tout autour de lui. Il est préférable que la disposition des imagettes respecte l'ordre chronologique de leur apparition dans le reportage. Au besoin, elles apparaissent avec un numéro ou en affichant le moment d'apparition à compter du début du reportage ou du document enregistré. Les moments d'apparition en minutes et secondes des images affichées sur la première ligne sont affichés dans l'exemple illustré par la figure 2. L'utilisateur a donc à sa disposition des informations à la fois sonores et visuelles résumant le contenu du reportage et lui permettant de le guider dans son choix de visionnage du reportage complet.

Lorsque le présentateur n'apparaît plus à l'écran, il devient inutile d'afficher l'image composite 2.1 et la visualisation du reportage continue de façon classique, sans traitement d'image au niveau du récepteur. Si l'utilisateur au vu de l'image composite 2.1 n e désire pas visualiser ce reportage, il appuie sur la touche ->, ce qui termine la visualisation du reportage. Le navigateur affiche alors le reportage suivant, l'écran prenant la même apparence que celle présentée à la figure 2. Une première façon d'extraire des imagettes consiste à analyser le reportages pour en déterminer les différents plan séquences. Un plan séquence (ou « shot » en Anglais) est une séquence ininterrompue tournée par une caméra ou un caméscope en une seule prise de vues. Les imagettes affichées sont les premières images des plans séquences du reportages. D'autres techniques sont utilisables. Par exemple, le navigateur peut choisir de prendre l'image médiane dans le plan séquence, c'est-à-dire l'image qui est au milieu du plan. Une autre technique consiste à extraire les images correspondant à un minimum d'activité. La mesure d'activité est une technique connue de l'Homme du métier, elle est généralement basée sur le mouvement dans les images. Il est également possible de sélectionner les imagettes contenant des visages en gros plans. D'autres techniques reposant sur l'analyse sémantique du contenu vidéo peuvent être également utilisées.

Selon un mode préféré de réalisation, les imagettes sont une photo inanimée extraite du reportage. Ce mode est facile à produire avec des moyens simples d'incrustation. En variante, une imagette est un plan séquence sélectionné dans le reportage. De ce fait, au début du reportage et pendant que le présentateur introduit le sujet, les plans séquences apparaissent les uns après les autres donnant ainsi une impression de mouvement. Le plan séquence disparaît de l'écran lorsqu'il se termine, Quelques secondes plus tard, un autre plan séquence apparaît à un autre endroit ou à un autre. L'apparition et la disparition des images animées ajoutent un coté ludique à l'apparence d'écran. Des tests ont montré que trois ou quatre visualisations de plans séquences offrent un bon compromis entre l'occupation de l'écran et la quantité d'information visuelle offerte à l'utilisateur.

La première partie d'un journal télévisé est généralement constituée d'un sommaire au cours duquel le présentateur présente les principaux reportages qui vont être développés dans le reste du journal. Selon une variante, le récepteur 1 modifie l'apparence des séquences vidéo du sommaire en rajoutant des imagettes afin que l'utilisateur perçoive plus d'informations sur les sujets que les informations données uniquement par le présentateur. Selon cette variante, un reportage est découpé en deux : la séquence vidéo du sommaire où le présentateur introduit le sujet du reportage, et le corps du reportage qui apparaît ensuite au cours du journal, et d'où sont extraits les imagettes.

La figure 4 présente un organigramme des étapes d'analyse d'un document vidéo enregistré permettant de générer une liste des liens entre le sommaire et les reportages et d'afficher les imagettes, pour la mise en œuvre de perfectionnement. A l'étape 4.1 , le document vidéo est enregistré dans le récepteur audiovisuel 1 . Il est par exemple reçu d'un réseau de diffusion. A l'étape 4.2, le document vidéo est segmenté en reportages. De nombreuses méthodes de la littérature proposent des solutions à ce problème. Par exemple, une technique possible consiste, suite à un découpage en plans de la vidéo à repérer les plans récurrents montrant une image déterminée, typiquement le présentateur du journal télévisé. Les différents plans présents entre les deux apparitions du présentateur sont regroupés au sein d'un même segment vidéo caractérisant un reportage. Dans un autre exemple, la vidéo est découpée en plans, puis, les plans sont regroupés en scènes en se basant sur la ressemblance visuelle des contenus des plans et leur proximité temporelle. On peut observer la composante audio en analysant l'ambiance sonore (un reportage sur un match de football, sur un documentaire écologique ou sur la dernière intervention d'un homme politique présentent des caractéristiques différentes), ou la continuité de la voix d'un même journaliste commentant son reportage. Les différents plans présents entre les deux apparitions du présentateur sont regroupés au sein d'un même segment vidéo caractérisant un reportage. Nous obtenons donc en sortie de ce module une liste de reportages ainsi qu'une liste de plans contenant le présentateur.

A l'étape 4.3, le navigateur analyse le document pour déterminer le sommaire. Typiquement, le sommaire se situe au début, plus rarement à la fin du document. Le sommaire peut être un seul plan séquence montrant un présentateur de face. Eventuellement, une musique déterminée est détectable en fond sonore du commentaire. La recherche des images du sommaire peut s'opérer suivant différentes hypothèses, par exemple :

- les images du sommaire contiennent des vignettes rectangulaires généralement fixes en haut à gauche ou en bas à droite du présentateur,

- le sommaire est diffusé au début du journal avant l'apparition du présentateur sous forme d'une succession de clips vidéo. D'autres techniques de reconnaissance visuelle existent. Par exemple, une sélection de l'ensemble des plans précédant le premier reportage est d'abord effectuée. Sur l'ensemble de ces plans, une détection de vignettes est mise en œuvre sur l'ensemble des images de chaque plan. Cette détection peut s'appuyer sur le fait que les vignettes apparaissent dans une partie de l'image, le reste de l'image demeurant quasi fixe. On peut utiliser par exemple un algorithme basé sur l'utilisation des images résultant de la différence entre images successives associée à une détection de forme rectangulaire par morphologie mathématique. Si le sommaire est diffusé en début de journal et que les images de reportages n'apparaissent pas en médaillon dans l'image mais en plein écran, il est possible d'utiliser une méthode de détection s'appuyant sur le fait que :

- le présentateur donne le résumé oral accompagnant le sommaire, ce qui peut permettre d'utiliser une segmentation en locuteur puis de sélectionner les images où le présentateur parle mais n'est pas visible ;

- le sommaire est généralement compris entre le générique et la première apparition du présentateur ; dans ce cas là, la détection du générique s'appuyant sur une détection des plages de musique ou sur une connaissance a priori du générique permet de retrouver le sommaire comme étant tout ce qui n'est pas générique.

Une fois le sommaire détecté, l'étape suivante 4.4 consiste à détecter les similitudes existant entre chaque portion du sommaire et chaque reportage. La méthode consiste ici à venir comparer les images du sommaire avec les images des reportages. Des techniques classiques d'extraction d'attributs caractéristiques de l'image associée à une mesure de distance permettent de fournir une mesure de similarité permettant de remonter à l'association des images sommaires et reportages. Dans de nombreux cas, on peut considérer que le sommaire est constitué de résumés vidéo des reportages associés, l'invention pourra avantageusement utiliser la composante temporelle pour rendre le processus de mise en correspondance d'images plus robuste. Par exemple, l'ordre de présentation des reportages dans le sommaire est généralement le même que celui des reportages du journal. La mesure de similarité est ainsi renforcée si les deux images présentant des similitudes se présentent dans le même ordre, les unes étant dans le sommaire, les autres dans les reportages.

Une fois cette étape réalisée, des couples formés d'une partie du sommaire et d'un reportage sont élaborés. Grâce à une interface utilisateur adaptée, ces associations vont maintenant être exploitées afin de donner plus d'information visuelle aux images du sommaire.

La figure 5 illustre le découpage d'un document et la détermination des similitudes entre des parties de sommaire et des reportages sur un journal télévisé. A la suite de la segmentation, le programme de traitement a déterminé que le sommaire comporte cinq parties et que le journal comporte cinq reportages. En analysant les similitudes entre les parties de sommaire et les reportages, le programme de traitement a pu établir quatre similitudes : la première partie du sommaire et le premier reportage, la seconde partie du sommaire et le second reportage, la troisième partie du sommaire et le quatrième reportage et la quatrième partie du sommaire avec le cinquième reportage. Dans l'exemple illustré par la figure 5, le troisième reportage n'a pas été annoncé dans le sommaire, ce reportage ne peut donc pas être indexé par une partie du sommaire, il vu au moment de la visualisation intégrale du journal enregistré.

A l'étape 4.5, l'utilisateur a demandé de visualiser le document, le sommaire est affiché dans un premier temps. Le navigateur affiche une image composite 2.1 en insérant dans les images de parties du sommaire, des images extraites du reportage associé. Les images extraites du reportage associé sont incrustées dans une fenêtre d'écran en haut à droite de l'écran. Les techniques d'incrustation étant bien connues de l'homme du métier, il n'est pas utile de les expliciter ici. De cette manière, l'utilisateur perçoit en plus du contenu sonore produit par le présentateur un contenu visuel lui informant de l'objet du reportage associé. Le même exemple d'image que celui montré à la figure 2 est ainsi généré.

L'utilisateur perçoit des informations à la fois sonores et visuelles résumant le contenu du reportage et lui permettant de la guider dans son choix de voir un reportage déterminé. Pendant la visualisation de cette partie du sommaire associé à ce reportage, le récepteur 1 émet le son du sommaire. Si l'utilisateur appuie sur la touche « OK » de la télécommande 8 au cours de la visualisation de cette partie de sommaire, le récepteur 1 extrait de la mémoire le reportage associé à cette partie et affiche en plein écran la vidéo de ce reportage en commençant par le début. A la fin de la vidéo, la visualisation revient automatiquement à la partie suivante du sommaire.

Selon un perfectionnement, l'utilisateur appuie sur la touche sommaire, la visualisation de la vidéo s'arrête, et la première imagette du reportage correspondante est mise graphiquement en évidence. L'utilisateur peut alors naviguer sur les imagettes à l'aide des touches de direction. Après en avoir sélectionné une, en appuyant sur « OK », le récepteur 1 extrait de la mémoire la séquence du reportage qui commence par l'imagette sélectionné et l'affiche à l'écran. De même que précédemment, à la fin du reportage, la visualisation revient automatiquement à la partie suivante du sommaire.

Selon un perfectionnement, les imagettes de l'image composite 2.1 servent d'index pour accéder à la partie du reportage les contenant. Lorsque l'image composite 2.1 est affichée, l'utilisateur appuie sur la touche « STOP » ce qui fige l'image de l'écran, l'image du présentateur étant alors mise graphiquement en évidence. En utilisant les touches de navigation, l'utilisateur navigue sur les imagettes et en met une en évidence. Puis, en appuyant sur la touche « OK », l'utilisateur déclenche la visualisation du plan séquence du reportage contenant l'image ainsi sélectionnée. Lorsque la fin du plan séquence est atteinte, l'écran affiche de nouveau l'image composite 2.1 au moment où sa visualisation a été arrêtée.

Selon un perfectionnement, le document comporte en association des données audiovisuelles, des informations textuelles. Typiquement ces informations sont diffusées pour les personnes mal entendantes et affichées en bas de l'écran sur requête de l'utilisateur. Ces informations textuelles contenues dans des métadonnées, sont associées à des reportages. Lorsque l'utilisateur affiche l'image composite 2.1 créée par le récepteur 1 , une zone de l'écran affiche au moins une partie du texte contenu dans ces informations supplémentaires. En variante, le récepteur 1 dispose d'un moyen de reconnaissance vocale permettant d'analyser la parole du présentateur au cours du reportage et de la convertir en texte. Le texte transcrit à partir des signaux audio est affiché pendant la visualisation du sommaire. Selon un autre perfectionnement, la visualisation d'une image composite 2.1 comme présentée par la figure 2 s'effectue au cours d'une durée déterminée. En effet, au début de la partie du sommaire correspondant à un reportage, le présentateur introduit le sujet mais à la fin de cette partie, l'utilisateur est bien au courant du reportage et n'a plus besoin d'être informé par les imagettes. De sorte que, ces imagettes peuvent être enlevées et l'image du présentateur peut apparaître seul en plein écran. Des tests ont montré qu'au bout de dix secondes, le sujet est bien introduit et les imagettes apportent peu d'informations en plus de ce qui a été dit.

Bien que la présente invention ait été décrite en référence aux modes de réalisation particuliers illustrés, celle-ci n'est nullement limitée par ces modes de réalisation, mais ne l'est que par les revendications annexées. On notera que des changements ou des modifications pourront être apportés par l'Homme du métier.

Claims

Revendications

1. Procédé de création d'un nouveau document audiovisuel à partir d'un document audiovisuel enregistré dans un appareil, le document enregistré comportant une séquence vidéo (2.2) présentant une caractéristique particulière, tel que l'image d'un présentateur ; caractérisé en ce qu'il comporte les étapes suivantes :

- création d'une séquence vidéo composite (2.1 ) composée des images extraites de la séquence vidéo enregistrée combinées à au moins une image extraite du document à un moment n'appartenant pas à la séquence vidéo enregistré.

2. Procédé de création selon la revendication 1 , le document comportant un sommaire composé d'une pluralité de séquences vidéo (2.2) présentant ladite caractéristique particulière et une pluralité de reportages dont certain au moins est associé à une séquence vidéo (2.2) ; caractérisé en ce qu'il comporte au sein de l'appareil les étapes suivantes :

- découpage du document (4.2) enregistré en une pluralité de reportages, - découpage du sommaire (4.3) en séquences vidéo et association de chaque séquence vidéo avec le reportage correspondant (4.4)

- création d'autant de séquences vidéo composite (2.1 ) que de séquences vidéo extraites du document enregistré, chaque séquence vidéo composite étant composée d'images extraites de la séquence vidéo enregistrée combinées à au moins une image extraite du reportage associé.

3. Procédé de création selon la revendication 2 ; caractérisé en ce qu'il comporte en outre une étape d'introduction d'une commande lors de l'affichage de la séquence vidéo composite déclenchant la visualisation plein écran du reportage associé.

4. Procédé de création selon l'une quelconque des revendications 2 et 3 ; caractérisé en ce qu'il comporte une étape d'introduction d'une commande d'interruption de l'affichage de la séquence vidéo composite, déclenchant une nouvelle étape d'affichage de la séquence vidéo composite correspondant au reportage suivant.

5. Procédé de création selon l'une quelconque des revendications précédentes ; caractérisé en ce qu'il comporte une étape d'introduction d'une commande de sélection d'une image (2.3) extraite du document à un moment n'appartenant pas à la séquence vidéo enregistré, déclenchant une étape de visualisation du plan séquence dont est extraite ladite image sélectionnée.

6. Procédé de création selon l'une quelconque des revendications précédentes ; caractérisé en ce qu'il comporte une étape d'affichage d'une séquence vidéo composite (2.1 ) d'une durée déterminée au début de la séquence vidéo (2.2) présentant une caractéristique particulière.

7. Procédé de création selon l'une quelconque des revendications précédentes ; caractérisé en ce que l'étape de création comporte le rajout d'informations textuelles diffusées dans des informations de services et associées au document.

8. Procédé de création selon l'une quelconque des revendications précédentes ; caractérisé en ce que l'étape de création comporte le rajout d'une indication horaire associée à un image extraite du document à un moment n'appartenant pas à la séquence vidéo enregistré, l'indication horaire identifiant le moment d'apparition au sein du document de cette image.

9. Récepteur audiovisuel (1 ) comprenant une unité centrale (3), un moyen de reproduction (10) d'au moins une partie d'un document audiovisuel enregistré dans un moyen de stockage (9), le document comportant au moins une première séquence vidéo présentant une caractéristique particulière, tel que l'image d'un présentateur ; caractérisé en ce qu'il comporte un moyen de création (3, 12) d'une séquence vidéo composite (2.1 ) composée des images (2.2) extraites de la séquence vidéo enregistrée combinées à au moins une image (2.3) extraite du document à un moment n'appartenant pas à la séquence vidéo enregistrée.

10. Récepteur audiovisuel (1 ) selon la revendication 9, le document comportant un sommaire composé d'une pluralité de séquences vidéo (2.2) présentant ladite caractéristique particulière et une pluralité de reportages dont certain au moins est associé à une séquence vidéo (2.2) ; caractérisé en ce qu'il comporte :

- un moyen de découpage (3, 12) en une pluralité de reportages du document enregistré dans le moyen de stockage (9),

- un moyen de découpage du sommaire (4.3) en séquences vidéo et un moyen d'association de chaque séquence vidéo avec le reportage correspondant (4.4), le moyen de création créant autant de séquences vidéo composite (2.1 ) que de séquences vidéo extraites du document enregistré, chaque séquence vidéo composite étant composée d'images extraites de la séquence vidéo enregistrée combinées à au moins une image extraite du reportage associé.

11. Récepteur audiovisuel (1 ) selon la revendication 10 ; caractérisé en ce qu'il comporte un moyen d'introduction (7,8) d'une commande déclenchant lors de l'affichage de la séquence vidéo composite la visualisation plein écran du reportage associé.

12. Récepteur audiovisuel (1 ) selon l'une quelconque des revendications 10 et 11 ; caractérisé en ce qu'il comporte un moyen d'introduction (7,8) d'une commande interrompant l'affichage de la séquence vidéo composite, et déclenchant l'affichage de la séquence vidéo composite correspondant au reportage suivant.

13. Récepteur audiovisuel (1 ) selon l'une quelconque des revendications 9 à 12 ; caractérisé en ce qu'il comporte un moyen d'introduction (7,8) d'une commande de sélection d'une image (2.3) extraite du document à un moment n'appartenant pas à la séquence vidéo enregistré, déclenchant l'affichage du plan séquence dont est extraite ladite image sélectionnée.

14. Récepteur audiovisuel (1 ) selon l'une quelconque des revendications 9 à 13 ; caractérisé en ce que le moyen de reproduction (10) affiche la séquence vidéo composite (2.1 ) au cours d'une durée déterminée au début de la séquence vidéo (2.2) présentant une caractéristique particulière.

15. Récepteur audiovisuel (1 ) selon l'une quelconque des revendications 9 à 14 ; caractérisé en ce que le moyen de création (3,12) rajoute à la séquence vidéo composite des informations textuelles diffusées dans des informations de services et associées au document.

16. Récepteur audiovisuel (1 ) selon l'une quelconque des revendications 9 à 15 ; caractérisé en ce que le moyen de création (3,12) rajoute à la séquence composite une indication horaire associée à une image extraite du document à un moment n'appartenant pas à la séquence vidéo enregistré, l'indication horaire identifiant le moment d'apparition au sein du document de cette image.