FR2856867A1 - Systeme pour generer un script temporel a partir d'une liste de documents - Google Patents

Systeme pour generer un script temporel a partir d'une liste de documents Download PDF

Info

Publication number
FR2856867A1
FR2856867A1 FR0307696A FR0307696A FR2856867A1 FR 2856867 A1 FR2856867 A1 FR 2856867A1 FR 0307696 A FR0307696 A FR 0307696A FR 0307696 A FR0307696 A FR 0307696A FR 2856867 A1 FR2856867 A1 FR 2856867A1
Authority
FR
France
Prior art keywords
document
marker
time
markers
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR0307696A
Other languages
English (en)
Other versions
FR2856867B1 (fr
Inventor
Ghislain Moncomble
Jean Pierre Remy
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Priority to FR0307696A priority Critical patent/FR2856867B1/fr
Publication of FR2856867A1 publication Critical patent/FR2856867A1/fr
Application granted granted Critical
Publication of FR2856867B1 publication Critical patent/FR2856867B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4938Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/28Timers or timing mechanisms used in protocols

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Time Recorders, Dirve Recorders, Access Control (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

Un script temporel est généré à partir d'une liste de documents sélectionnés dans des serveurs de document (SW1-SWI) depuis des terminaux (T) et comportant des parties au moins textuelles. Un générateur de marqueurs (GM) estime une durée de synthèse vocale pour chaque partie textuelle (PT) en fonction d'un nombre d'unités élémentaires textuelles prédéterminées dans la partie textuelle (NCPT) et d'un débit prédéterminé (D). Le générateur de marqueurs (GM) génère également des marqueurs temporels de début et fin de chaque partie textuelle (PT) respectivement selon les durées de synthèse vocale estimées afin de reporter ces marqueurs dans le script temporel.

Description

Système pour générer un script temporel à partir d'une liste de documents La présente invention concerne un système pour générer un script temporel à partir d'une liste de documents au moins textuel. Plus particulièrement l'invention transforme et présente temporellement des éléments statiques d'un document comme des parties textuelles, des liens et des images.
Actuellement, des systèmes de synthèse vocale transforment des documents textuels en des documents audio, par exemple lors d'une lecture d'un signal audio enregistré résultant de la synthèse vocale de textes contenus dans des courriers électroniques. Lorsque le texte est long, certains systèmes cherchent à rompre régulièrement la monotonie de la voix de synthèse en additionnant du bruit de fond et en faisant varier des paramètres vocaux au cours de la synthèse vocale. La monotonie étant rompue uniquement à certains moments réguliers, bien souvent périodiques, la voix synthétisée conserve encore un caractère artificiel. Ces systèmes transforment des documents textuels ou des parties textuelles extraites de documents multimédias au fur et à mesure de la synthèse vocale.
Des systèmes d'animation synchronisent automatiquement des images avec du son, comme la synchronisation entre les mouvements d'une bouche d'une représentation faciale et les sons d'un signal vocal. Le signal vocal est en général issu de la synthèse vocale d'un document textuel. Mais ces systèmes ne visent pas à représenter l'ensemble des éléments constitutifs d'un document multimédia comme des images et des liens contenus dans le document multimédia.
L'objectif de la présente invention est de générer automatiquement un script temporel des différents éléments d'une liste de documents multimédias, comme des paragraphes, des images et des hyperliens.
Pour atteindre cet objectif, un système pour générer un script temporel à partir d'une liste de documents sélectionnés dans des serveurs de document depuis des terminaux et comportant des parties au moins textuelles est caractérisé en ce qu'il comprend un moyen pour estimer une durée de synthèse vocale pour chaque partie textuelle en fonction d'un nombre d'unités élémentaires textuelles prédéterminées dans la partie textuelle et d'un débit prédéterminé, et un moyen pour générer des marqueurs temporels de début et fin de chaque partie textuelle respectivement selon les durées de synthèse vocale estimées afin de reporter ces marqueurs dans le script temporel.
Le système de génération de script selon l'invention comprend de préférence un moyen pour générer des marqueurs temporels de paramètre vocal en dépendance des marqueurs temporels de début et de fin de partie textuelle afin d'indiquer dans le script temporel des variations de paramètre vocal associés à une voix de synthèse.
Relativement aux hyperliens textuels, le système de génération de script peut comporter un moyen pour détecter un hyperlien inclus dans un document de la liste, et un moyen pour générer des marqueurs temporels de début et fin d'activité de l'hyperlien confondus respectivement avec les marqueur de début et de fin d'une partie textuelle incluant l'hyperlien.
Relativement aux images, le système de génération de script peut comporter un moyen pour détecter une image incluse dans un document de la liste, et un moyen pour générer un marqueur temporel de début d'image correspondant au début de l'image détectée et un marqueur temporel de fin d'image succédant d'une durée prédéterminée au marqueur temporel de début d'image.
En pratique, le système de l'invention est implémenté essentiellement dans un serveur dédié à l'élaboration de scripts temporels.
D'autres caractéristiques et avantages de la présente invention apparaîtront plus clairement à la lecture de la description suivante de plusieurs réalisations préférées de l'invention, à titre d'exemples non limitatifs, en référence aux dessins annexés correspondants dans lesquels : - la figure 1 est un bloc-diagramme schématique d'un système pour élaborer un script temporel de document, selon une réalisation de l'invention ; - la figure 2 est un diagramme temporel des éléments constitutifs de deux documents multimédias successifs ; et - la figure 3 est un bloc-diagramme schématique d'un module de base servant particulièrement à actualiser des documents multimédias dans un terminal.
Un système pour générer un script temporel selon l'invention est basé sur une architecture du type client-serveur. Il comprend principalement, en référence à la figure 1, plusieurs terminaux d'usager interactifs T et au moins un serveur de génération de script temporel SS. Le serveur de script SS comprend classiquement une unité centrale de traitement UT, au moins une mémoire de caractéristiques de documents à deux tables TA1-TA2, un analyseur de document AD, un générateur de marqueur GM et selon les variantes énoncées postérieurement une unité de détermination de contexte UDC.
Selon la réalisation illustrée à la figure 1, un terminal d'usager T est par exemple du type récepteur de télévision intelligent RT. Le récepteur de télévision RT coopère avec une télécommande à afficheur et clavier alphanumérique TC servant également de souris à travers une liaison infrarouge IR, et avec un module de base MB à travers une liaison radioélectrique de proximité LP de type Bluetooth ou selon la norme 802.11b. En variante, la télécommande est complétée par un clavier plus complet sans fil relié par liaison radioélectrique de proximité au module MB. Le module de base MB contient une unité centrale de traitement UC gérant notamment des applications propres à l'invention et de préférence un navigateur ainsi que des modules décrits plus bas.Une mémoire tampon MT est incluse dans le module MB et fait office de cache pour mémoriser des documents multimédias sélectionnés par l'un des usagers du terminal T ainsi qu'un sommaire présentant cette liste de documents ainsi constituée. La mémoire tampon MT est gérée par un module de gestion de cache MGC. Optionnellement un synthétiseur vocal SV est prévu dans le module MB pour une reproduction sonore ou une transcription vocale de document selon le script temporel généré, via des haut-parleurs du récepteur RT.
Le module de base MB peut desservir d'autres terminaux domestiques portables ou non tels que micro-ordinateur, téléphone, poste de radio, centrale d'alarme, etc. Le module MB est desservi par une liaison de télécommunications LT et un réseau d'accès RA, tels qu'une ligne téléphonique et le réseau téléphonique commuté RTC, pour être connecté à un réseau de transmission de paquets à haut débit RP du type internet auquel est relié le serveur central SC.
Le terminal d'usager et le réseau d'accès ne sont pas limités aux types illustrés à la figure 1 et peuvent être constitués par d'autres terminaux et réseaux d'accès connus. Par exemple, le terminal d'usager T de préférence doté au moins d'un hautparleur peut être un ordinateur personnel PC relié directement par modem à la liaison LT ou par l'intermédiaire d'un module de base MB. Selon d'autres variantes, le terminal d'usager T comprend un dispositif ou objet électronique de télécommunications personnel à l'usager qui peut être un assistant numérique personnel PDA, ou bien comprend un poste radio intelligent à la place du récepteur de télévision RT, les deux types de récepteur pouvant coexister.La liaison de télécommunications LT peut être une ligne xDSL (Digital Subscriber Line) ou une ligne RNIS (Réseau Numérique à Intégration de Services) reliée au réseau d'accès correspondant. Selon encore une autre variante, le terminal T peut être un terminal radiotéléphonique cellulaire mobile, la liaison de télécommunications peut être un canal radiotéléphonique, et le réseau d'accès peut être le réseau fixe d'un réseau de radiotéléphonie.
Dans la description ci-après, un document au moins textuel d'une liste de documents est en général une page ou un ensemble de pages constituant une rubrique ou bien la totalité des pages pouvant être consulté et téléchargé dans l'un de plusieurs serveurs de document SW1 à SWI illustrés schématiquement à la figure 1. Un document peut contenir du texte et/ou du graphique et/ou des hyperliens et/ou des images fixes, telles que photographies, et/ou des images animées, telles que séquences vidéo ou films, et/ou du son, tel que morceaux musicaux.
Un script temporel est un fichier contenant les données des représentations temporelles des éléments constitutifs de documents d'une liste. On considérera d'abord ces éléments comme des parties textuelles extraites d'un document.
Lorsqu'un seul document est traité par le système, un début de script temporel d'un document est un début d'une représentation temporelle du premier élément constituant le document et constitue une origine temporelle de marqueur. En général, le système traite une liste de documents, et un début du premier élément d'un premier document de la liste constitue alors l'origine temporelle de marqueur. Des marqueurs temporels seront définis par la suite. L'origine temporelle des marqueurs peut être déplacée par une insertion dans le script temporel d'au moins un élément étranger aux documents de la liste, comme cela sera décrit plus loin.
Dans une première phase de constitution, des documents sont sélectionnés dans des serveurs de document SW1 à SWI depuis des terminaux afin de constituer des listes de documents. L'usager d'un terminal T constitue par exemple ces listes en surfant au moyen d'un navigateur.
La mémoire tampon MT du terminal T mémorise pour chaque document DM sélectionné, un nom et une adresse URL (Uniform Resource Locator) IPDM de celui-ci ainsi que des caractéristiques CDM du document. Les caractéristiques d'un document donné peuvent être la gratuité ou le coût du document, des dates de début et de fin d'abonnement si le document est payant, l'autorisation parentale conseillée, un identificateur de liste, etc...
Le serveur de script SS mémorise également dans la mémoire de caractéristique TA1-TA2 les caractéristiques des documents.
La première table TA1 fait correspondre à l'adresse IPDM (Internet Protocol) de chaque document sélectionné par au moins l'un des usagers une liste d'identificateurs USID relatifs à des usagers ayant sélectionné ce document. L'adresse IPDM d'un document DM est associée notamment à des caractéristiques CDM.
La deuxième table TA2 fait correspondre à l'identificateur USID de chaque usager au moins une liste d'adresses internet IPDM de documents multimédias que souhaite consulter l'usager. Les adresses de document IPDM dans la liste sont classées selon un ordre de consultation des documents sélectionnés dépendant de l'intérêt que l'usager porte à ceux-ci.
Dans une deuxième phase, indépendante de la phase de constitution, les documents des listes dans un terminal sont actualisés régulièrement.
En référence à la figure 1, l'analyseur de document AD analyse un premier document DM1 comportant au moins un texte afin d'abord de décomposer le texte du document en des parties textuelles successives PT. Les parties textuelles successives sont par exemple des paragraphes, des titres et des résumés. Une partie textuelle est considérée comme un élément constitutif du document.
Une mémoire tampon de l'analyseur de document AD mémorise temporairement les parties textuelles et des caractéristiques respectivement associées à cellesci. Les caractéristiques d'une partie textuelle PT sont au moins un identificateur de la partie textuelle, une référence au document DM1 incluant ladite partie, un nombre de caractères textuels NCPT dans la partie textuelle et une position PPT de la partie textuelle dans le document DM1 par rapport aux autres éléments constituant le document.
Selon d'autres variantes, une partie textuelle est divisée en d'autres unités élémentaires textuelles prédéterminées que les caractères textuels. Par exemple, une unité élémentaire textuelle est une unité phonétique telle qu'une syllabe ou un mot ou un élément grammatical d'un mot tel qu'une unité syntagmatique, une unité syntaxique, etc.
La position PPT d'une partie textuelle est déterminée par le nombre de caractères textuels inclus dans des parties textuelles dans le document DM1 précédant ladite partie textuelle.
L'analyseur de document AD est basé, de manière connue, sur une analyse sémantique et syntaxique du texte d'un document, sur l'analyse d'un éventuel code source du document, et sur la disposition du texte dans le document.
Le générateur de marqueur GM reçoit en entrée les parties textuelles associées à au moins leurs positions et leurs nombres de caractères respectifs.
Le script temporel est réalisé notamment dans le but d'une représentation audio et/ou audio vidéo ultérieure d'une liste de documents. Dans une variante, ces représentations ultérieures simulent un langage de signes pour personnes malentendantes. Les parties textuelles seront éventuellement synthétisées ultérieurement par un synthétiseur vocal. Il est supposé dans la suite de la description que les caractéristiques du synthétiseur vocal sont connues, comme par exemple des voix de synthèse disponibles ou encore des variations possibles sur une tonalité de voix de synthèse.
Le générateur GM estime une durée d'une synthèse vocale DSVpT définie pour chaque partie textuelle PT en fonction du nombre NCpT d'unités élémentaires textuelles prédéterminées, telles que des caractères, dans la partie textuelle PT, d'un débit prédéterminé D et éventuellement d'un facteur correctif. Pour un prochain document qui est technique, le facteur correctif traduit une consultation plus longue parce qu'un document technique est plus difficile à appréhender qu'un document classique. Dans une variante, le module de script SS comprend un module de détermination de contexte qui détermine un contexte d'un document donné et ainsi permet au générateur de marqueur GM d'établir une valeur du facteur correctif d'un document en fonction du contexte de celui-ci.
En variante, le débit prédéterminé D est une moyenne du débit d'une voix utilisée lors de la synthèse vocale ultérieure des parties textuelles pendant une durée prédéterminée, par exemple une minute environ. Après que les durées de synthèse vocale de toutes les parties textuelles du premier document DM1 aient été déterminées, le générateur GM génère des marqueurs temporels de début DpT et de fin FpT de chaque partie textuelle PT respectivement selon les durées de synthèse vocale estimées afin de reporter ces marqueurs dans le script temporel, et plus précisément de telle façon que la différence FpT-DpT pour une partie textuelle PT soit égale à la durée de synthèse vocale estimée de la partie textuelle.Comme montré pour des parties textuelles successives 2PT1 et 2PT2 d'un document DM2, compris entre des marqueurs temporels 2DPT1 et 2FPT2 à une deuxième ligne de la figure 2, le marqueur de début 2DPT2 d'une partie textuelle 2PT2 excepté la première partie textuelle du document est a priori confondu avec le marqueur de fin 2FpTl de la partie textuelle précédente 2PT1 dans le document DM2.Le marqueur de fin 2FPT1 d'une partie textuelle 2PT1, excepté la dernière partie textuelle du document, est a priori confondu avec le marqueur de début 2DpT2 de la partie textuelle suivante 2pT2 dans le document 2DM2 La synthèse vocale ultérieure des parties textuelles sera définie en dépendance de paramètres vocaux PV, qui peuvent varier d'une représentation audio d'une partie textuelle à une représentation audio d'une partie textuelle suivante et à l'intérieur même d'une représentation audio d'une partie textuelle.Les paramètres vocaux sont par exemple le sexe masculin ou féminin, l'âge sous la forme d'une période relative à l'enfance ou l'adolescence ou l'âge adulte ou la vieillesse, des caractères prosodiques tels que des durées successives de segments syllabiques, l'emphase portant notamment sur l'accent sur des constituants de phrase, les fréquences laryngiennes et fondamentale relatives à la hauteur de la voix, le débit ou le rythme de parole qui peut être lent ou rapide ou intermédiaire, le niveau de son exprimé en décibels, etc.
Le générateur de marqueurs GM génère alors des marqueurs temporels de paramètre vocal VT1, VT2 en dépendance des marqueurs temporels de début DPT et de fin FpT de partie textuelle PT. Les marqueurs de paramètres vocaux indiquent des variations des paramètres vocaux que devra respecter un synthétiseur vocal lors de la synthèse vocale ultérieure des parties textuelles afin de rompre la monotonie de la voix de synthèse vocale. Par exemple des marqueurs de paramètres vocaux VT1 et VT2 indiquant une variation de la tonalité de la voix de la synthèse vocale ultérieure sont représentés figure 2. Généralement, un marqueur de voix est confondu avec le marqueur de début ou de fin d'une partie textuelle d'un document.En variante, le générateur de marqueurs GM génère des marqueurs de début et de fin de paramètres vocaux en fonction du contexte de partie textuelle déterminé par l'unité de détermination de contexte UDC montré à la figure 1.
Les paramètres vocaux sur lequel le synthétiseur vocal agit ultérieurement, comme la tonalité, sont indiqués dans les règles, ainsi que les proportions de la variation. Par exemple, un marqueur de paramètre vocal est généré dans le script temporel lorsque l'estimation de la durée de la synthèse vocale d'une partie textuelle est supérieure à une durée prédéterminée, par exemple à 30 secondes environ. Selon un autre exemple, un marqueur de paramètre vocal (VT1, VT2) indique une variation d'au moins l'un des paramètres vocaux de la voix de synthèse.
En variante, le serveur de script SS comprend un catalogue de fichiers relatif à des voix dont des empreintes ont été enregistrées et analysées afin de mémoriser des paramètres vocaux essentiels de ces voix. Dans cette variante une voix de synthèse vocale différente sera en général appliquée à chaque document de la liste. Ainsi tous les paramètres vocaux pour deux documents successifs DM1 et DM2 sont différents respectivement afin d'offrir une réelle rupture vocale entre deux deuxièmes documents successifs, comme cela pourrait se produire dans la réalité entre deux journalistes présentant consécutivement deux documents abordant des thèmes de reportage différents. Le générateur GM génère alors des marqueurs temporels de voix afin d'indiquer des changements de voix de synthèse dans le script.Sur la figure 2 est montré un marqueur de voix Vv indiquant le changement de voix entre le premier et le deuxième document. Pour chaque document de la liste, le générateur génère des marqueurs de voix VV confondu avec le marqueur temporel de début DPT d'une première partie textuelle du document. Dans une variante les marqueurs de voix ne sont pas reportés sur le script temporel, et les variations de la voix de synthèse vocale sont définies dans des règles, uniquement en fonction des autres marqueurs, comme les marqueurs de parties textuelles. Dans une autre variante, la variation d'au moins un paramètre vocal n'est pas indiquée par les marqueurs de paramètre vocal (VT1, VT2) d'un même document, afin d'assurer une continuité vocale dans la synthèse vocale ultérieure des parties textuelles d'un document.
De la même manière que pour les marqueurs de paramètres vocaux, le générateur de marqueur GM génère des marqueurs de début et de fin de bruitage indiquant les bornes entre lesquelles un bruitage doit être inséré afin une nouvelle fois de rompre une monotonie de la voix de synthèse vocale utilisée ultérieurement. Les marqueurs de bruitage sont souvent confondus avec des marqueurs de parties textuelles. Un intervalle défini par des marqueurs de début et de fin de bruitage englobe généralement plusieurs intervalles définis par des marqueurs de partie textuelle. En effet, un bruit peut être ajouté sur plusieurs documents consécutifs d'une liste. En variante, le serveur de script SS dispose d'un deuxième catalogue de fichiers relatif à des bruitages qui peuvent être des effets sonores, des sons spéciaux ou des morceaux musicaux.Les marqueurs temporels de début et de fin de bruitage sont alors associés à un fichier de bruit. Chaque bruitage est défini par des paramètres vocaux qui peuvent être comparés à des moyennes des paramètres vocaux de la voix de synthèse vocale ultérieure, afin de choisir le bruitage et définir ainsi les marqueurs de début et de fin de ce bruitage. En variante, le bruitage est choisi par comparaison de contexte de bruitage et de parties textuelles dont les marqueurs temporels appartiennent aux bornes entre lesquelles le bruitage est inséré.
L'analyseur de document AD montré à la figure 1 détecte également d'autres parties composant le document de la liste comme des hyperliens textuels HL, des images I, des sons, des séquences vidéo. La mémoire tampon de l'analyseur de document AD mémorise temporairement les liens et des caractéristiques respectivement associées à ceux-ci. Les caractéristiques des hyperliens textuels sont au moins un identificateur de lien, une référence au document incluant ledit hyperlien textuel HL, un texte, une adresse URL (Uniform Resource Locator) et une position temporelle PHL du lien dans le document.La position temporelle PHL ou le début du lien est déterminée par l'analyseur de document AD en fonction du nombre de caractères textuels appartenant à des parties textuelles précédant l'hyperlien dans le document, selon le même principe décrit que pour les parties textuelles. L'analyse de document dans l'analyseur AD est basée ici, en outre, non seulement sur la disposition des parties textuelles dans le document, mais également sur la disposition d'hyperliens et d'images dans le document.
Un hyperlien est représenté dans le script temporel par des marqueurs d'activité et le cas échéant par des marqueurs d'affichage et des marqueurs d'annonce. Des marqueurs de début et de fin d'activité d'un hyperlien indique à partir du marqueur d'activité de début une durée pendant laquelle l'hyperlien est actif et donc pouvant être sélectionné ultérieurement par un usager d'un terminal suivant le procédé décrit dans le brevet français 0205821.
Le générateur de marqueur GM génère un marqueur d'activité temporel de début DHL d'un hyperlien HL très souvent textuel et détecté par l'analyseur AD, et un marqueur d'activité temporel de fin FHL du lien HL succédant d'une durée déterminée THL au marqueur d'activité de début. Le marqueur d'activité temporel de début DHL est confondu avec le marqueur de début de la partie textuelle dans lequel est inséré le lien et le marqueur temporel d'activité de fin FHL est confondu avec le marqueur de fin de la même partie textuelle. Par exemple, un hyperlien 1HL1 détecté dans le document DM1 a ses marqueurs d'activité de début 1DHL1 et de fin 1FHL1 montrés à une troisième ligne de la figure 2.
Des marqueurs de début et de fin d'affichage d'un hyperlien indique à partir du marqueur d'affichage de début une durée pendant laquelle un hyperlien sera affiché ultérieurement sur un écran d'un terminal usager. Le générateur GM génère un marqueur de début d'affichage ADHL confondu avec le marqueur de début DPT d'une partie textuelle incluant l'hyperlien HL et un marqueur temporel de fin d'affichage AFHL succédant d'une durée d'affichage prédéterminée au marqueur temporel de début d'affichage ADHL. Dans ce cas, le terminal T dispose d'un afficheur, tel que le récepteur de télévision RT, sur lequel sont affichés des éléments graphiques des documents de la liste comme des images, des séquences vidéo et également des hyperliens textuels, par exemple sous forme de sous-titres.Un marqueur d'affichage de début d'un hyperlien est confondu avec un marqueur de début d'une partie textuelle incluant l'hyperlien et le marqueur d'affichage de fin de l'hyperlien est déterminé en fonction d'une durée d'affichage de l'hyperlien.
Par exemple le lien HL1 a ses marqueurs d'affichage lADHLl et 1AFHL1 représentés à la troisième ligne de la figure 2 et séparée d'une durée d'affichage 1TAHL qui est estimée selon le temps nécessaire à un usager d'un terminal T pour visualiser le lien. La durée 1TAHL est par exemple d'une minute environ.
L'affichage éventuel de plusieurs liens simultanément ne pose aucune difficulté technique.
En variante, une unité de détermination de contexte détermine la pertinence des liens en comparant le contexte ou le texte d'un hyperlien avec des contextes de parties textuelles proches de l'hyperlien afin de ne générer des marqueurs d'affichage ou d'annonce que pour le lien ou l'ensemble de liens le plus pertinent.
De la même manière, des marqueurs de début et de fin d'une annonce d'un hyperlien indique une durée d'écoute pendant laquelle l'hyperlien est annoncé vocalement. Le marqueur de début d'annonce de l'hyperlien correspond à la position temporelle PHL de l'hyperlien. Le marqueur de fin d'annonce de l'hyperlien succède d'une durée de l'annonce au marqueur de début d'annonce de l'hyperlien. Ces marqueurs d'annonce sont générés par le générateur de marqueur GM. Lorsqu'un lien, tel que le lien 1HL1 dans le document DM1 est annoncé vocalement, les marqueurs temporels liés à une information audio postérieure au marqueur de début d'annonce de l'hyperlien sont décalés de la durée de l'annonce de l'hyperlien par le générateur.La durée de l'annonce entre les marqueurs d'annonce de début et de fin de l'hyperlien est estimée par l'analyseur de document AD en fonction du débit prédéterminé D et du nombre d'unités élémentaires textuelles dans l'annonce vocale de l'hyperlien. L'annonce vocale de l'hyperlien est du type "pour obtenir des compléments d'informations, consultez le site...". L'annonce vocale peut comporter le texte de l'hyperlien et l'adresse URL du site. Dans le cas où des marqueurs d'annonce d'hyperlien se superposent, l'annonce vocale est du type "Pour en savoir plus, nombreuses sources d'informations complémentaires". Dans une autre variante, tous les marqueurs d'annonce d'hyperliens se situent entre un marqueur de fin de document et un marqueur de début de document.
Dans une variante, le générateur GM génère des marqueurs temporels de début et de fin d'activité, d'affichage et d'annonce d'un hyperlien inclus dans un document en dépendance d'un contexte ou du texte de l'hyperlien et de contextes au moins de parties textuelles du document proches de l'hyperlien, et déterminés par une unité de détermination de contexte reliée ou intégrée au générateur de marqueur GM.
Le terme "contexte" désigne une liste de mots ou expressions clés et de leurs équivalents. Chaque mot ou expression clé caractérise un contexte susceptible d'être abordé dans un document. Certains contextes sont des combinaisons de contextes, ou dans le cas de contextes d'actualités ou régionaux, des combinaisons de contextes précisés par un nom propre, telles que par exemple : Météo Normandie, Guerre Irak, etc. L'unité de détermination de contexte détermine les contextes des parties textuelles d'un document et compare ceux-ci au texte ou au contexte prédéterminé d'un hyperlien contenu dans le document afin de déterminer les marqueurs d'affichage ou d'annonce de l'hyperlien HL correspondant aux marqueurs temporels d'une ou plusieurs parties textuelles ayant un contexte similaire à l'hyperlien HL.Des contextes similaires entre une partie textuelle du premier document et l'hyperlien HL peuvent être déterminés plus finement en analysant, par exemple, le contexte de chacune des phrases du document au lieu de chacune des parties textuelles.
Le générateur GM génère les durées d'activité, d'affichage et d'annonce de l'hyperlien textuel HL en dépendance également d'un temps de réaction prédéterminé. Ce temps de réaction est ajouté à la durée d'écoute/affichage précédente du lien HL, et est nécessaire à l'appréhension de l'hyperlien par l'usager du terminal après l'écoute et/ou l'affichage du lien. Ce temps de réaction permet par exemple de noter l'hyperlien ou de cliquer sur celui-ci.
Plus généralement, l'annonce vocale de l'hyperlien est combinée à l'affichage de l'hyperlien.
Les images incluses dans un document sont détectées également par l'analyseur de document AD. Pour afficher les images temporellement synchronisées avec les parties textuelles du document, le terminal T dispose d'un afficheur tel que le récepteur de télévision RT. Dans le cas d'un terminal T ne pouvant recevoir que des documents du type audio, les marqueurs d'images ou tout autre marqueur d'élément graphique comme une séquence vidéo seront ignorés.Les caractéristiques d'une image I sont au moins un identificateur d'image, une référence au document incluant ladite image, les dimensions de l'image telle que hauteur et largeur, le texte de la légende éventuelle (correspondant à l'attribut ALT de la balise IMG pour un document HTML) , et éventuellement une position temporelle PI. La position temporelle ou le début de l'image PI dans le document est définie par l'estimation de la durée de synthèse vocale du nombre de caractères textuels précédant l'image et appartenant à des parties textuelles du document.
Le générateur GM génère des marqueurs temporels pour toutes les images contenues dans chaque document de la liste.
Le générateur de marqueur GM génère un marqueur de début DI d'une image contenue dans un document confondu avec un marqueur temporel d'une partie textuelle incluant l'image, et un marqueur temporel de fin FI de l'image succédant d'une durée prédéterminée TI au marqueur temporel de début DI de l'image.
Dans une variante, le générateur de marqueur GM génère un marqueur d'image de début DI et de fin FI en dépendance d'un contexte de l'image et de contextes au moins de parties textuelles temporellement proches de l'image. Les marqueurs de début et de fin d'image correspondent alors aux marqueurs temporels d'une ou plusieurs parties textuelles ayant un contexte similaire à celui de l'image. Le contexte de l'image peut être déterminé par une unité de détermination de contexte d'image reliée ou intégrée au générateur de marqueur GM et analysant notamment des contours et formes de l'image.
Dans une autre variante, le contexte de l'image est déterminé par le contexte des parties textuelles proches de l'image, ou encore lorsqu'il s'agit de document HTML par le contenu d'un attribut "alt", d'une balise "img" indiquant l'insertion d'une image spécifique.
Dans une autre variante, le générateur de marqueur GM génère un marqueur de début DI d'une image correspondant au début PI de l'image détectée et un marqueur temporel de fin FI succédant d'une durée prédéterminée TI au marqueur temporel de début DI.
La durée prédéterminée TI entre les marqueurs de début DI et de fin d'image FI est déterminée en général selon une estimation du temps d'affichage minimum nécessaire à l'usager du terminal pour appréhender l'image, soit environ 4 secondes. L'image sera ultérieurement affichée sur l'afficheur du terminal pendant la durée prédéterminée TI selon les marqueurs de l'image.
Par exemple, deux images 1I1 et 1I2 du document DM1 et une image 2I1 du document DM2 suivant ont respectivement des durées d'affichage 1TI1, 1TI2 et 2TI1 bornés par des marqueurs de début et fin 1DI11FI1, 1DI2-1FI2 et 2DI1-2FI1 montrées à une quatrième ligne de la figure 2.
Dans une autre variante, le marqueur temporel de fin d'une image est déterminé afin que le marqueur de début d'une prochaine image soit confondu avec ledit marqueur temporel de fin de l'image précédente. Cette variante permet d'afficher en permanence une image sur l'écran du terminal.
En variante, l'analyseur de document AD détermine le type de l'image I. Le type de l'image dépend de la position de l'image dans la structure graphique du premier document DM1 et éventuellement de la position de l'image dans le code source du premier document. Ainsi, des images de type logo et image de fond sont différenciées afin par exemple d'afficher en haut à gauche le logo et l'image de fond en arrière-plan pendant par exemple la durée d'un document entier.
Dans une autre variante, le système pour élaborer un script temporel d'un document comporte une base de données d'images. Lorsqu'un marqueur de fin d'une image et un marqueur de début d'une autre image succédant ne sont pas confondus, le générateur de marqueur GM insère entre ledit marqueur de début et de fin, des marqueurs de début et de fin d'une image mémorisée dans la base de données d'images. Les marqueurs de début et de fin de l'image mémorisée sont alors confondus respectivement avec le marqueur de fin d'une image et le marqueur de début d'une image suivante. De préférence, le générateur sélectionne une image dont le contexte est similaire à celui des parties textuelles temporellement proches de l'image.De la même manière, des marqueurs de début et de fin d'une séquence vidéo sélectionnée dans une base de données vide peuvent être insérés dans le script temporel.
Le générateur de marqueur GM génère également un marqueur temporel de fin Fpo d'une portion PO, associée à un fichier de portion, à introduire dans le script temporel à la suite d'une durée prédéterminée Tpo de ladite portion succédant à un marqueur temporel de fin généré FPT relatif à une partie PT textuelle. Un exemple d'une portion 1PO de marqueur de début 1DPO et de fin 1FPO insérée dans le script temporel est montré à une cinquième ligne de la figure 2. Les marqueurs temporels succédant au marqueur de fin de portion, comme 1DI2-1FI2, 1DPT21FPT2 sont décalés temporellement de la durée prédéterminée 1TPO de la portion.
Des portions, comme la portion PO, sont insérées afin de rompre la monotonie de la voix de synthèse vocale, environ toutes les 2,5 minutes. Par exemple, la durée prédéterminée Tpo de ladite portion est supérieure à 7 secondes environ et inférieure à 30 secondes environ. Une portion n'est pas insérée lorsque la durée de celui-ci n'excède pas une durée prédéterminée de l'ordre de 5 minutes.
Ces portions sont extraites d'une base de données publicitaire. Les documents de la liste comporte parfois des panneaux publicitaires. Dans le cas de document HTML, ces panneaux sont généralement des bandeaux publicitaires situés en haut ou en bas du document. Ces panneaux publicitaires sont extraits de leur document d'origine afin d'être mémorisés et ordonnés selon leur provenance dans la base de données publicitaires, tout en évitant de mémoriser un panneau publicitaire deux fois.
Dans une autre variante, des portions sont récupérées sur des serveurs web SW distribuant du contenu pertinent par rapport aux documents de la liste.
Dans une autre variante, ces portions sont extraites d'un catalogue de fichiers audio et/ou vidéo depuis un serveur connecté au réseau de paquets RP ou dans le serveur de script SS lui-même. Les fichiers sont caractérisés au moins par un type (audio, vidéo, audio et vidéo) et une durée. Ces portions sont par exemple des publicités, ou des courtes séquences d'images fixes ou animées par exemple de paysages avec un fond musical.
En général, les publicités de document affichées dans un document HTML sont gérées par une régie publicitaire. Cette régie publicitaire comporte au moins un serveur web de publicité SWi connecté au réseau de paquets RP et distribuant les publicités vers plusieurs sites web. Chaque serveur web de publicité contient des présentations différentes, par exemple audio et/ou vidéo, relatives à une même publicité. L'unité centrale UT du serveur de script SS récupère alors automatiquement la publicité ayant un type audio et/ou vidéo adaptée au terminal d'usager T, afin que celle-ci soit ultérieurement traitée comme une portion PO dont les marqueurs temporels sont à insérer dans le script temporel. A ce titre, le procédé décrit dans le brevet français 0116431 peut être mis en oeuvre dans la présente invention.
De préférence ces portions sont regroupées en plages de publicité entre des marqueurs temporels de deux documents successifs et non pas entre des marqueurs de début et de fin d'un même document. Dans une variante, des marqueurs de portions tels que des chansons sont également insérées.
De plus, l'analyseur de document AD détecte un titre dans un document puis estime une durée de synthèse vocale du titre détecté du document en fonction d'un nombre d'unités élémentaires textuelles dans le titre et du débit prédéterminé D. Le générateur GM génère un marqueur de fin de titre précédant un marqueur de début d'une première partie textuelle du document, et un marqueur de début de titre précédant le marqueur de fin de titre de la durée du titre estimée.
De la même manière, l'analyseur de document AD détecte un résumé inclus dans un document puis estime une durée de synthèse vocale du résumé détecté du document en fonction d'un nombre d'unités élémentaires textuelles dans le résumé et du débit prédéterminé D. Ensuite le générateur GM génère un marqueur de fin de résumé précédant un marqueur de début d'une première partie textuelle du document, et un marqueur de début de résumé précédant le marqueur de fin de résumé de la durée de résumé estimée.
En variante lorsque le résumé du document n'est pas détecté par l'analyseur de document, l'unité de détermination de contexte UDC détermine un contexte du document de la liste, afin de constituer un résumé du document selon le contexte du document et ensuite de générer les marqueurs du résumé constitué.
De la même manière, lorsqu'un titre d'un document de la liste n'est pas détecté par l'analyseur de document AD, l'unité de détermination de contexte détermine un titre en fonction d'un contexte du document.
Plus précisément, le marqueur de début du résumé du document précède, voire est généralement confondu avec le marqueur de fin de titre du document.
Le générateur de marqueur GM génère également des marqueurs temporels de début DDM2 et de fin FDM2 du document DM2 confondus respectivement avec le marqueur de début de la première partie du document DM2 et le marqueur de fin de la dernière partie du document DM2, comme illustré à titre d'exemple dans la figure 2.
Le générateur de marqueur GM génère le script temporel de la liste de documents script de document par script de document. Le générateur génère alors des scripts de document, pour constituer le script temporel de la liste de documents. La génération du script d'un document ne dépend que du document analysé, sans aucune intervention de l'usager du document. La génération par document est donc mutualisée pour tous les usagers. Le script temporel généré pour chaque document est mémorisé dans la table TA1 en correspondance avec l'adresse de document IPDM. Chaque liste de documents est constituée par un usager particulier. Les scripts temporels générés des documents dans une liste de documents de l'usager sont ensuite concaténés et analysés ensemble en fonction des marqueurs relatifs aux documents de la liste pour constituer le script temporel de la liste.Le script de la liste est mémorisé dans la table TA2 en correspondance avec l'identificateur d'usager USID.
Comme décrit précédemment, des marqueurs de bruitage peuvent être ajoutés au niveau de marqueurs temporels de plusieurs documents consécutifs, tandis que pour les marqueurs d'hyperliens sont seulement considérés les marqueurs des parties textuelles temporellement proches de l'hyperlien ou de la partie textuelle contenant l'hyperlien. Dans une variante, les marqueurs des portions publicitaires sont générés en considérant la liste de documents dans son intégralité, afin d'éviter par exemple la répétition d'une même portion publicitaire et que la somme des durées indiquées par les marqueurs de portion ne dépasse une durée limite. Cette durée limite dépend d'une durée totale du script temporel de la liste de documents.
Comme montré précédemment, des variations de paramètres vocaux sont indiquées sur le script temporel par des marqueurs. Mais ces variations sont également analysées par le générateur de marqueur afin d'homogénéiser ces variations sur la durée totale du script. Un changement de voix n'intervient pas entre les marqueurs temporels d'un même document, mais entre les marqueurs de deux documents ou de plusieurs documents.
Comme vu précédemment, des marqueurs temporels de voix sont également reportés sur le script temporel. Dans le cas d'une représentation visuelle ultérieure sur un écran d'un terminal d'usager, la voix est représentée visuellement par exemple par une animation faciale qui peut être la face d'un journaliste connu. A chaque marqueur de voix est alors associé un changement de représentation faciale. Un moteur d'animation faciale utilisé ultérieurement est supposé connu, en particulier une liste des représentations faciales disponibles, afin de sélectionner une représentation faciale selon des caractéristiques de la représentation faciale et des paramètres vocaux de la voix de synthèse connue.
Afin de présenter ultérieurement les documents de la liste selon les souhaits de l'usager du terminal, l'usager a précédemment ordonné les documents de sa liste dans un ordre de consultation préféré. Par extraction d'informations contenues dans les documents ordonnés et détectées par l'analyseur de document AD, l'analyseur de document AD détermine une présentation textuelle de la liste nécessaire à présenter en outre les titres de chaque document de la liste et estime la durée de synthèse vocale de la présentation déterminée en fonction d'un nombre d'unités élémentaires textuelles dans la présentation et du débit prédéterminé D.Le générateur GM génère un marqueur de fin de la présentation de la liste de documents précédant un marqueur de début d'une première partie textuelle d'un premier document de la liste, et un marqueur de début de la présentation de la liste de documents précédant le marqueur de fin de présentation de la durée estimée de la présentation. Des marqueurs temporels de début et de fin d'une présentation sont ainsi insérés au début du script d'une liste. Cette insertion décale de la durée de présentation les autres marqueurs.
Dans une variante, un usager du terminal définit ses préférences, par exemple en sélectionnant des voix pour le présentateur et des journalistes, et plus généralement des voix d'intervenants, des représentations faciales d'intervenants, des bruitages.
Comme décrit précédemment, afin de garantir une qualité des informations contenues dans les documents de la liste, ces derniers sont régulièrement actualisés dans la phase d'actualisation. Une fois que l'usager a procédé à la sélection de documents, un système d'actualisation actualise automatiquement les documents sélectionnés en fonction d'options de téléchargement décrites plus loin. Le système d'actualisation est réparti entre le terminal et le serveur de scripts. Le module de base MB dans le terminal, montré à la figure 3, comprend au moins un lecteur Ll, deux comparateurs de date Cl et C2, un comparateur de document CD, et un module de téléchargement TT.
Le système d'actualisation mutualise les ressources de plusieurs terminaux. Lors de la mise en marche du terminal T, le lecteur Ll lit dans la mémoire tampon MT des premières dates DDM1 incluses dans les caractéristiques CDM et l'adresse IPDM de tous les documents sélectionnés ainsi que l'identificateur d'usager USID et un identificateur de terminal IPTE. Le lecteur Ll communique l'identificateur d'usager USID et l'identificateur de terminal IPTE au serveur de script SS. Si le serveur de script SS reconnaît l'identificateur d'usager USID associé à l'identificateur de terminal IPTE, le serveur de script renvoie un fichier contenant la liste des caractéristiques CDM de tous les documents sélectionnés associés à l'adresse IPDM, dont une deuxième date DDM2 du document lue par le lecteur Ll.
Dans une variante, l'actualisation des documents sélectionnés dans le terminal T est commandée par le serveur de script SS à des instants préprogrammés par l'usager du terminal. Dans cette variante, le terminal et le serveur de script sont de préférence reliés par une liaison permanente.
Au sens de l'invention, une date de document est exprimée de préférence en jour, heure et minute et une date d'édition d'un document est la date à laquelle le document a été publiée.
Le comparateur de date Cl compare pour chaque document donné sélectionné, la première date DDM1 et la deuxième date DDM2. Il est supposé que lorsque la deuxième date DDM2 d'un document donné DM1 est égale ou plus ancienne que la première date DDM1 du document donné, le document donné n'a pas varié. La version du document donné déjà présente dans la mémoire tampon MT est alors diffusée dans le terminal de l'usager. Le document donné est accessible à l'usager depuis son terminal, et une transmission du document donné dans le réseau de paquets RP est évitée.
La sortie du premier comparateur de date Cl est reliée au module de téléchargement TT.
Le module de téléchargement TT télécharge depuis le serveur SW, correspondant à l'adresse IPDM du document, le document donné dans une version plus récente, appelée nouveau document donné NDM, en correspondance avec l'adresse IPDM du document lorsque la deuxième date DDM2 est strictement postérieure à la première date DDM1. Puis, le module TT commande l'écriture du nouveau document donné NDM dans la mémoire tampon MT ainsi que les caractéristiques de celui-ci comme une date d'édition du document DE et une date de dernier téléchargement, appelée également troisième date de téléchargement DDM3, à la place de la première date DDM1 du document. Cette troisième date DDM3 est considérée ensuite sur le terminal T comme une première date DDM1 lors d'une prochaine actualisation du document donné.
Dans une variante, la troisième date ne correspond pas à la date de téléchargement du document dans le terminal, mais à la date d'édition du document.
Le comparateur C2 compare ensuite la deuxième date DDM2 et la date d'édition DE du nouveau document NDM téléchargé.
Le comparateur C2 transmet la date d'édition DE et l'adresse IPDM ainsi que d'éventuelles caractéristiques du nouveau document NDM au serveur de script SS, lorsque la date d'édition DE est postérieure à la deuxième date DDM2. Le comparateur C2 transmet également la troisième date du document téléchargé associé à l'identificateur de terminal IPTE.
La table de mémoire TA1 du serveur de script mémorise alors la date d'édition DE à la place et en tant que la deuxième date DDM2 en association avec l'adresse IPDM du document donné DM pour une prochaine actualisation du document donné demandé par n'importe quel terminal d'usager abonné au service d'actualisation. De même, la table de mémoire TA2 mémorise la troisième date DDM3 à la place et en tant que première date DDM1 en association avec l'identificateur de terminal IPTE et l'adresse de document IPDM.
Lorsque la deuxième date DDM2 d'un document est remplacée par la date d'édition DE mémorisée dans la table de mémoire TA1, le serveur de script régénère les marqueurs temporels associés au document et mémorise ces marqueurs régénérés du document dans la table TA1. Ensuite, le script temporel complet de la liste de documents comportant au moins un document dont les marqueurs ont été régénérés est également régénéré. Le module de téléchargement TT dans le terminal télécharge ensuite sous forme d'un fichier le script temporel régénéré ainsi que des fichiers qui sont nécessaires au script, c'est-à-dire qui sont associés à des marqueurs temporels générés inclus dans le script régénéré.Ces fichiers nécessaires au script diffèrent des documents sélectionnés par l'usager et ne sont pas mémorisés dans la mémoire tampon MT du terminal (fichiers nouveaux) ou ne présentent pas une version qui est mémorisée dans la mémoire tampon MT du terminal et qui n'est pas la plus récente (fichiers modifiés). Les fichiers nécessaires au script sont par exemple les fichiers des portions dont des marqueurs ont été insérés dans le script ou les fichiers contenant les bruits ajoutés, les images, les résumés, les titres, les présentations.
Le module de base MB s'assure de la réelle modification du contenu du document donné dans le comparateur de document CD lié au module de téléchargement TT avant l'écriture du nouveau document NDM dans la mémoire tampon MT. Le comparateur de document récupère la version ancienne du document donné identifié par son adresse IPDM dans la mémoire tampon MT et compare le contenu de cette version ancienne du document donné au nouveau document donné NDM qui a été précédemment téléchargé par le module de téléchargement TT. Cette comparaison peut être une comparaison bits à bits.Lorsque le nouveau document donné téléchargé est différent du document donné existant dans la mémoire tampon MT du terminal, le comparateur CD commande l'écriture du nouveau document NDM avec ses caractéristiques à la place de l'ancienne version dans la mémoire tampon MT du terminal et transfert la date d'édition DE et l'adresse IPDM du document donné au serveur de script SS. Dans le cas contraire, le document donné est considéré inchangé, le nouveau document n'est pas mémorisé dans la mémoire tampon MT et la troisième date n'est pas transférée au serveur de script.
Le système d'actualisation dépend du nombre d'usagers abonnés au service d'actualisation de documents multimédias et plus particulièrement du nombre d'usagers ayant en commun un document donné sélectionné. Plus le nombre d'usagers ayant en commun un document sélectionné est élevé, plus le document commun est régulièrement analysé par les modules de base des terminaux de ces usagers, plus la date d'actualisation DDM2 dans le serveur de script SS est récente et plus le script temporel généré à partir des documents est récent.
De préférence, un contrôleur d'actualisation de document CAD relié à la mémoire TA1-TA2 dans le serveur de script SS pallie une éventuelle actualisation peu fréquente d'un document donné due au petit nombre d'usagers mémorisés dans la table TAl et qui l'ont sélectionné. Le contrôleur CAD contrôle alors périodiquement la troisième date DDM3 d'un document donné la plus récente mémorisée dans le serveur de script SS afin de commander :
un téléchargement du document donné depuis l'un des serveurs de document SW1 -SWI en correspondance avec l'adresse IPDM du document donné vers le module de téléchargement TT du terminal, une lecture de la deuxième date DDM2 dans le lecteur Ll du terminal, et une comparaison de la deuxième date DDM2 et la date d'édition DE du document téléchargé dans le comparateur Cl du terminal, lorsque la différence entre une date courante et la troisième date du document donné la plus récente est supérieure à un seuil prédéterminé, pour que la date d'édition DE soit transmise au serveur de script SS lorsque la deuxième date DDM2 est antérieure à la date d'édition afin que le serveur de script mémorise la date d'édition à la place de la deuxième date DDM2 en correspondance avec l'adresse du document donné.
La date courante est la date du contrôle effectué par le contrôleur CAD.
Le terminal T peut fonctionner en permanence et disposer d'une liaison quasi-permanente avec le serveur de script SS.
Le seuil prédéterminé est déterminé en fonction d'un taux de variation d'un document multimédia donné. Le taux de variation est fixé dans le serveur de script SS à une moyenne du nombre de variations d'un document pendant un intervalle de temps. L'intervalle de temps est par exemple une semaine, un mois, ou plusieurs mois. Dans une variante, les taux de variation sur une semaine, un mois et six mois sont conservés afin de prendre en compte des périodes spéciales comme les vacances en lissant le taux de variation. Le taux de variation est écrit dans la table de mémoire TA1 du serveur de script SS en correspondance avec l'adresse IPDM du document donné. Le taux de variation est mis à jour dans le serveur de script à chaque changement de la deuxième date DDM2 du document donné.
Lors du choix par l'usager de ses préférences, l'usager précise pour chaque document ou pour chaque sélection une option de téléchargement définissant la période d'actualisation de document. Ces options de téléchargement sont mémorisées à la fois dans la mémoire TA1-TA2 du serveur de script SS et la mémoire MT du terminal T. Les exécutions des options de téléchargement sont contrôlées soit par l'unité centrale UC du terminal T soit par l'unité de traitement du serveur de script SS, mais les documents sont toujours téléchargés depuis le terminal T. Le serveur de script SS contrôle les actualisations selon les options de téléchargement dans le terminal T qui est alors en veille.
Dans une option de téléchargement, l'usager définit un intervalle de temps qu'il programme dans le terminal, par exemple une plage horaire de téléchargement avec une périodicité déterminée pour un document donné. Le terminal de l'usager télécharge la nouvelle version du document donné à actualiser depuis le serveur SW pendant la plage horaire. Par exemple, l'usager programme l'actualisation automatique tous les matins de 6 h à 7 h du document donné présentant la météo et donc du script temporel associé à la liste de documents, afin de pouvoir consulter ultérieurement la liste actualisée de documents transformés selon le script temporel généré.
REVENDICATIONS
1 - Système pour générer un script temporel à partir d'une liste de documents sélectionnés dans des serveurs de document (SW1-SWI) depuis des terminaux (T) et comportant des parties au moins textuelles, caractérisé en ce qu'il comprend un moyen (GM) pour estimer une durée de synthèse vocale (DSV) pour chaque partie textuelle (PT) en fonction d'un nombre d'unités élémentaires textuelles prédéterminées dans la partie textuelle (NCpT) et d'un débit prédéterminé (D), et un moyen (GM) pour générer des marqueurs temporels de début (DpT) et fin (FpT) de chaque partie textuelle (PT) respectivement selon les durées de synthèse vocale estimées afin de reporter ces marqueurs dans le script temporel.

Claims (16)

  1. 2 - Système conforme à la revendication 1, comprenant un moyen (GM) pour générer des marqueurs temporels de paramètre vocal (VT1, VT2) en dépendance des marqueurs temporels de début (DpT) et de fin
    (FpT) de partie textuelle (PT) afin d'indiquer dans le script temporel des variations de paramètres vocaux associés à une voix de synthèse. 3 - Système conforme à la revendication 2, dans lequel un marqueur de paramètre vocal (VT1, VT2) indique une variation d'au moins l'un des paramètres vocaux de la voix de synthèse. 4 - Système conforme à la revendication 2 ou 3, dans lequel la variation d'au moins un paramètre vocal n'est pas indiquée par les marqueurs de paramètre vocal (VT1, VT2) d'un même document. 5 - Système conforme à l'une quelconque des revendications 1 à 4, comprenant un moyen (GM) pour générer des marqueurs temporels de voix (VV) afin d'indiquer des changements d'une voix de synthèse dans le script temporel. 6 - Système conforme à la revendications 5, dans lequel pour chaque document de la liste le moyen (GM) pour générer des marqueurs de voix génère au moins un marqueur de voix (VV) confondu avec le marqueur temporel de début (DpT) d'une première partie textuelle du document. 7 - Système conforme à l'une quelconque des revendications 1 à 6, comprenant un moyen (GM) pour générer des marqueurs temporels de début et de fin de bruitage associé à un fichier de bruit et en dépendance des marqueurs temporels de début (DpT) et de fin (FPT) de parties textuelles (PT) de plusieurs documents. 8 - Système conforme à l'une quelconque des revendications 1 à 7, comprenant un moyen (AD) pour détecter un hyperlien (HL) inclus dans un document de la liste, et un moyen (GM) pour générer des marqueurs temporels de début (DHL) et fin (FHL) d'activité de l'hyperlien (HL) confondus respectivement avec les marqueurs de début (DpT) et de fin (FpT) d'une partie textuelle incluant l'hyperlien (HL).
  2. 9 - Système conforme à l'une quelconque des revendications 1 à 8, comprenant un moyen (AD) pour détecter un hyperlien (HL) inclus dans un document de la liste, et un moyen (GM) pour générer des marqueurs temporels de début (DHL) et fin (FHL) d'activité de l'hyperlien (HL) en dépendance d'un contexte ou d'un texte de l'hyperlien et de contextes de parties textuelles du document.
  3. 10 - Système conforme à l'une quelconque des revendications 1 à 9, comprenant un moyen (AD) pour détecter un hyperlien (HL) inclus dans un document de la liste, et un moyen (GM) pour générer un marqueur temporel de début d'affichage (ADHL) confondu avec le marqueur de début (DpT) d'une partie textuelle incluant l'hyperlien (HL) et un marqueur temporel de fin d'affichage (AFHL) succédant d'une durée d'affichage prédéterminée au marqueur temporel de début d'affichage (ADHL).
  4. 11 - Système conforme à l'une quelconque des revendications 1 à 10, comprenant un moyen (AD) pour détecter un hyperlien (HL) inclus dans un document de la liste, un moyen (AD) pour estimer une durée d'une annonce de l'hyperlien (HL) en fonction d'un nombre d'unités élémentaires textuelles dans l'annonce et du débit prédéterminé (D), un moyen (GM) pour générer un marqueur temporel de début d'annonce (ADHL) confondu avec une position temporelle (PHL) de l'hyperlien
    (HL) et un marqueur de fin d'annonce (AFHL) succédant de la durée de l'annonce estimée au marqueur de début d'annonce (ADHL) de l'hyperlien, et un moyen (GM) pour décaler de la durée de l'annonce estimée des marqueurs temporels postérieurs au marqueur de début d'annonce (ADHL) de l'hyperlien.
  5. 12 - Système conforme à l'une quelconque des revendications 9 à 11, dans lequel les durées d'annonce, d'affichage et d'activité de l'hyperlien textuel (HL) dépendent d'un temps de réaction prédéterminé.
  6. 13 - Système conforme à l'une quelconque des revendications 1 à 12, comprenant un moyen (AD) pour détecter une image (I) incluse dans un document de la liste, et un moyen (GM) pour générer un marqueur temporel de début d'image (DI) correspondant au début
    (PI) de l'image détectée et un marqueur temporel de fin d'image (FI) succédant d'une durée prédéterminée
    (TI) au marqueur temporel de début d'image.
  7. 14 - Système conforme à l'une quelconque des revendications 1 à 13, comprenant un moyen (AD) pour détecter une image (I) incluse dans un document de la liste, et un moyen (GM) pour générer des marqueurs temporels de début d'image (DI) et de fin d'image
    (FI) en dépendance d'un contexte de l'image et de contextes de parties textuelles du document.
  8. 15 - Système conforme à l'une quelconque des revendications 1 à 14, comprenant un moyen (GM) pour générer des marqueurs de début et de fin d'une image mémorisée dans une base de données d'image, confondus respectivement avec un marqueur de fin d'une image et un marqueur de début d'une image suivante lorsque le marqueur de fin d'une image et le marqueur de début de l'image suivante ne sont pas confondus.
  9. 16 - Système conforme à l'une quelconque des revendications 1 à 15, comprenant un moyen (GM) pour générer un marqueur temporel de fin (Fpo) d'une portion (PO), associée à un fichier de portion, à introduire dans le script temporel à la suite d'une durée prédéterminée (Tpo) de ladite portion succédant à un marqueur temporel de fin généré (FpT) relatif à une partie textuelle (PT), des marqueurs temporels succédant au marqueur de fin de la portion étant décalés temporellement de la durée prédéterminée de la portion.
  10. 17 - Système conforme à l'une quelconque des revendications 1 à 16, dans lequel le moyen (GM) pour générer génère des scripts de document, pour constituer le script temporel de la liste de documents.
  11. 18 - Système conforme à l'une quelconque des revendications 1 à 17, comprenant un moyen (AD) pour déterminer une présentation textuelle de la liste de documents et un moyen (AD) pour estimer une durée de synthèse vocale de la présentation déterminée en fonction d'un nombre d'unités élémentaires textuelles dans la présentation et du débit prédéterminé (D), et un moyen (GM) pour générer un marqueur de fin de la présentation de la liste précédant un marqueur de début d'une première partie textuelle d'un premier document de la liste et un marqueur de début de la présentation précédent le marqueur de fin de présentation de la durée de présentation estimée.
  12. 19 - Système conforme à l'une quelconque des revendications 1 à 18, comprenant un moyen (AD) pour détecter un titre inclus dans un document de la liste, un moyen (AD) pour estimer une durée de synthèse vocale du titre détecté du document en fonction d'un nombre d'unités élémentaires textuelles dans le titre et du débit prédéterminé (D), et un moyen pour générer (GM) un marqueur de fin de titre précédent un marqueur de début d'une première partie textuelle du document et un marqueur de début de titre précédant le marqueur de fin de titre de la durée du titre estimée.
  13. 20 - Système conforme à l'une quelconque des revendications 1 à 19, comprenant un moyen (UDC) pour constituer un titre d'un document de la liste en fonction d'un contexte du document, un moyen pour estimer une durée de synthèse vocale du titre constitué du document en fonction d'un nombre d'unités élémentaires textuelles dans le titre et du débit prédéterminé (D), et un moyen (GM) pour générer un marqueur de fin de titre précédant un marqueur de début d'une première partie textuelle d'un premier document de la liste et un marqueur de début de titre précédant le marqueur de fin de titre de la durée du titre estimée.
  14. 21 - Système conforme à l'une quelconque des revendications 1 à 20, comprenant un moyen (AD) pour détecter un résumé inclus dans un document de la liste, un moyen (AD) pour estimer une durée de synthèse vocale du résumé détecté du document en fonction d'un nombre d'unités élémentaires textuelles dans le résumé et du débit prédéterminé (D), et un moyen pour générer (GM) un marqueur de fin de résumé précédent un marqueur de début d'une première partie textuelle du document et un marqueur de début de résumé précédant le marqueur de fin de résumé de la durée de résumé estimée.
  15. 22 - Système conforme à l'une quelconque des revendications 1 à 21, comprenant un moyen (UDC) pour constituer un résumé d'un document de la liste en fonction d'un contexte du document, un moyen pour estimer une durée de synthèse vocale du résumé du document en fonction d'un nombre d'unités élémentaires textuelles dans le résumé et du débit prédéterminé (D), et un moyen (GM) pour générer un marqueur de fin de résumé confondu avec un marqueur de début d'une première partie textuelle d'un premier document de la liste et un marqueur de début de résumé précédant le marqueur de fin de résumé de la durée de résumé estimée.
  16. 23 - Système conforme aux revendications 1 à 22, caractérisé en ce que chaque terminal (T) identifié par un identificateur (IPTE) comprend une mémoire tampon (MT) pour mémoriser temporairement la liste de documents sélectionnés depuis le terminal et associés respectivement à des caractéristiques incluant une première date (DDM1) et une adresse (IPDM), un moyen (Ll) pour lire une deuxième date (DDM2) mémorisée en correspondance avec l'adresse (IPDM) d'un document donné (DM) de la liste dans un serveur de script (SS), un premier moyen (Cl) pour comparer la première date (DDM1) du document donné à la deuxième date lue
    (DDM2) du document donné, un moyen (TT) pour télécharger à une troisième date de téléchargement (DDM3) le document donné depuis l'un des serveurs de document (SW1-SWI) en correspondance avec l'adresse (IPDM) du document donné (DM) lorsque la première date (DDM1) est antérieure à la deuxième date (DDM2), un moyen (TT) pour écrire la troisième date
    (DDM3) du document téléchargé à la place de la première date (DDM1) dans la mémoire tampon (MT), et un deuxième moyen (C2) pour comparer la deuxième date (DDM2) à une date d'édition (DE) du document téléchargé afin que la date d'édition (DE) soit transmise au serveur de script (SS) pour la mémoriser à la place de la deuxième date (DDM2) et en correspondance avec l'adresse (IPDM) du document donné lorsque la deuxième date est antérieure à la date d'édition (DE) ; et en ce que le système comprend un moyen (GM) pour régénérer les marqueurs temporels du document donné lorsque la date d'édition (DE) est mémorisée à la place de la deuxième date (DDM2) ; et un moyen (GM) pour régénérer le script temporel de la liste de documents afin que le moyen pour télécharger (TT) dans le terminal télécharge le script temporel régénéré ainsi que des fichiers associés à des marqueurs temporels générés inclus dans le script régénéré.
FR0307696A 2003-06-25 2003-06-25 Systeme pour generer un script temporel a partir d'une liste de documents Expired - Fee Related FR2856867B1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR0307696A FR2856867B1 (fr) 2003-06-25 2003-06-25 Systeme pour generer un script temporel a partir d'une liste de documents

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0307696A FR2856867B1 (fr) 2003-06-25 2003-06-25 Systeme pour generer un script temporel a partir d'une liste de documents

Publications (2)

Publication Number Publication Date
FR2856867A1 true FR2856867A1 (fr) 2004-12-31
FR2856867B1 FR2856867B1 (fr) 2005-08-05

Family

ID=33515412

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0307696A Expired - Fee Related FR2856867B1 (fr) 2003-06-25 2003-06-25 Systeme pour generer un script temporel a partir d'une liste de documents

Country Status (1)

Country Link
FR (1) FR2856867B1 (fr)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079301B (zh) * 2006-07-28 2010-06-09 埃里克·路易斯·汉森 一种计算机实现的创建从文本到音频记录的时序映射方法
FR3104780A1 (fr) 2019-12-17 2021-06-18 Groupe Tabatabaï Procede de production automatique d’un compte-rendu multimedia numerique d’une expertise d’un sinistre

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0992980A2 (fr) * 1998-10-06 2000-04-12 Lucent Technologies Inc. Menu interactif à réponse vocale basé sur le web
WO2002037469A2 (fr) * 2000-10-30 2002-05-10 Infinity Voice Holdings Ltd. Systeme et procede de generation de la parole

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0992980A2 (fr) * 1998-10-06 2000-04-12 Lucent Technologies Inc. Menu interactif à réponse vocale basé sur le web
WO2002037469A2 (fr) * 2000-10-30 2002-05-10 Infinity Voice Holdings Ltd. Systeme et procede de generation de la parole

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ASAKAWA C ET AL: "USER INTERFACE OF A HOME PAGE READER", THE THIRD INTERNATIONAL ACM CONFERENCE ON ASSISTIVE TECHNOLOGIES. ASSETS '98. MARINA DEL REY, CA, APRIL 15 - 17, 1998, INTERNATIONAL ACM CONFERENCE ON ASSISTIVE TECHNOLOGIES, NEW YORK, NY: ACM, US, vol. 3RD CONF, 15 April 1998 (1998-04-15), pages 149 - 156, XP000776791, ISBN: 1-58113-020-1 *
KAZUHIRO KONDO ET AL: "A WWW BROWSER USING SPEECH RECOGNITION AND ITS EVALUATION", SYSTEMS & COMPUTERS IN JAPAN, SCRIPTA TECHNICA JOURNALS. NEW YORK, US, vol. 29, no. 10, 1 September 1998 (1998-09-01), pages 57 - 66, XP000786722, ISSN: 0882-1666 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079301B (zh) * 2006-07-28 2010-06-09 埃里克·路易斯·汉森 一种计算机实现的创建从文本到音频记录的时序映射方法
FR3104780A1 (fr) 2019-12-17 2021-06-18 Groupe Tabatabaï Procede de production automatique d’un compte-rendu multimedia numerique d’une expertise d’un sinistre

Also Published As

Publication number Publication date
FR2856867B1 (fr) 2005-08-05

Similar Documents

Publication Publication Date Title
US20200366726A1 (en) Method of downloading digital content to be rendered
US10237595B2 (en) Simultaneously rendering a plurality of digital media streams in a synchronized manner by using a descriptor file
US20190173690A1 (en) Simultaneously rendering an image stream of static graphic images and a corresponding audio stream
CA2600884C (fr) Procede et appareil de montage de media
US6557042B1 (en) Multimedia summary generation employing user feedback
US5721827A (en) System for electrically distributing personalized information
US7149359B1 (en) Searching and recording media streams
US20060136556A1 (en) Systems and methods for personalizing audio data
US20080005347A1 (en) Messenger system for publishing podcasts
EP2060084A1 (fr) Architecture d'acces a un flux de donnees au moyen d'un terminal utilisateur
FR2856867A1 (fr) Systeme pour generer un script temporel a partir d'une liste de documents
JPH07123273B2 (ja) マルチメディア情報を伝送する方法
JP2004062769A (ja) コンテンツ出力装置
Fagerjord Four axes of rhetorical convergence
FR2851352A1 (fr) Systeme de conversion d'un signal audio continu en un signal audiot traduit et synthetise
Kuosmanen Getting Your Daily Flix: A Reception Study of Netflix and Its Subtitles
EP1481339B1 (fr) Procede et dispositif de traitement informatique d'un contenu audiovisuel avec sous-titres
WO2003063133A1 (fr) Personnalisation de la presentation sonore de messages synthetises dans un terminal
WO2003027897A2 (fr) Constitution d'une liste de documents multimedias selectionnes et actualises depuis un terminal
FR2809205A1 (fr) Procede et systeme d'acces a un ensemble d'informations stockees dans une base de donnees et relatives a un evenement actuel ou passe, en particulier une chanson diffusee par une station de radiodiffusion
EP1479012A2 (fr) Indexation automatique de documents audio-textuels en fonction de leur difficulte de comprehension
FR2787897A1 (fr) Procede et dispositif d'ajout d'information a un fichier informatique
WO2003054736A1 (fr) Adaptation de la presentation de documents telecharges aux modes de lecture de terminaux
FR2929425A1 (fr) Procede et dispositif de production, diffusion et publication en serie de videos et leurs descriptions respectives, a partir d'informations d'origine non audiovisuelles
FR2833725A1 (fr) Adaptation de la presentation de documents telecharges aux modes de lecture de terminaux

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20130228