FR2815435A1 - Procede et dispositif de reutilisation d'information ayant fait l'objet d'une reception anterieure dans un reseau de telecommunication tel que le reseau internet - Google Patents

Procede et dispositif de reutilisation d'information ayant fait l'objet d'une reception anterieure dans un reseau de telecommunication tel que le reseau internet Download PDF

Info

Publication number
FR2815435A1
FR2815435A1 FR0013419A FR0013419A FR2815435A1 FR 2815435 A1 FR2815435 A1 FR 2815435A1 FR 0013419 A FR0013419 A FR 0013419A FR 0013419 A FR0013419 A FR 0013419A FR 2815435 A1 FR2815435 A1 FR 2815435A1
Authority
FR
France
Prior art keywords
objects
information
files
intermediate storage
stage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
FR0013419A
Other languages
English (en)
Inventor
Luigi Lancieri
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Priority to FR0013419A priority Critical patent/FR2815435A1/fr
Priority to PCT/FR2001/003196 priority patent/WO2002033588A1/fr
Priority to AU2002210645A priority patent/AU2002210645A1/en
Priority to US10/399,370 priority patent/US20040014469A1/en
Priority to CNA018189067A priority patent/CN1527977A/zh
Priority to EP20010978539 priority patent/EP1328879A1/fr
Publication of FR2815435A1 publication Critical patent/FR2815435A1/fr
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

La présente invention concerne un procédé et un dispositif de réutilisation d'information antérieurement reçue par un élément destinataire auquel est associé un moyen de stockage intermédiaire (10), au sein d'un réseau de télécommunication tel que le réseau Internet. Ledit moyen de stockage intermédiaire (10), par exemple un proxy cache, est adapté à stocker temporairement de l'information constitutive d'objets transmis audit élément destinataire consécutivement à des requêtes successives dudit élément destinataire. Ledit procédé comprend une étape consistant à copier tous les objets contenus dans ledit moyen de stockage intermédiaire (10) qui satisfont à des critères prédéterminés, et une étape consistant à stocker avec indexation appropriée les copies effectuées desdits objets dans un moyen de gestion d'objets (30), par exemple un serveur Web, associé audit élément destinataire.Ne sont copiés notamment que les objets qui sont supérieurs à une taille prédéterminée.

Description

<Desc/Clms Page number 1>
La présente invention concerne un procédé et un dispositif de réutilisation d'information antérieurement reçue par un élément destinataire au sein d'un réseau de télécommunication, notamment le réseau Internet. Par élément destinataire, on entend un élément local du réseau de télécommunication par l'intermédiaire duquel des utilisateurs peuvent accéder à de l'information contenue sur le réseau de télécommunication. Par exemple, lorsque le réseau de télécommunication est le réseau
Internet, il peut s'agir d'un réseau informatique local hébergeant un site d'entreprise.
Dans un réseau de télécommunication comme le réseau Internet, de l'information est disponible au niveau de sites répartis sur le réseau et est accessible à partir d'un point d'accès quelconque comme un terminal utilisateur. Un système d'information réparti comme le World Wide Web met à la disposition des utilisateurs un ensemble distribué de documents multimédias composites reliés entre eux par des liens hypertextes. Les sites et les documents Web, identifiés par des adresses appelées URL (pour Uniform Resource Locator), sont accessibles et visualisables grâce à des logiciels appelés navigateurs. D'autres systèmes d'information existent. De manière générale, on désignera par le terme objet un ensemble de données formant un contenu individuel visé par l'utilisateur. Un objet pourra être constitué de fichiers tels que des pages HTML (pour Hypertext Mark-up Language), des images, des sons, etc. On désignera par le terme lien le moyen d'accès à un objet. Il pourra s'agir, par exemple, d'un lien hypertexte
Un type courant d'accès à l'information se fait par le biais d'un serveur. Une fonction d'un serveur est de délivrer, à la requête d'un utilisateur, une information effectivement contenue dans un ensemble d'informations auquel il est associé. Le serveur permet à un utilisateur d'accéder à de l'information contenue par exemple dans un réseau local distant. Par exemple, un serveur Web reçoit une requête HTTP d'accès à un objet émise par le terminal utilisateur et transmet en retour l'objet demandé sous forme de message. Le terme HTTP (pour Hyper Text Transfer Protocol) désigne un protocole d'accès bien connu à une adresse URL du Web.
Un premier problème à résoudre dans ce domaine technique concerne la rapidité d'accès aux données Sur le réseau Internet, la transmission de messages est confrontée à des problèmes de volume de trafic limitant le débit de transmission de données et augmentant les temps d'attente.
Une solution pour réduire ce problème consiste à utiliser, afin d'assister les serveurs d'origine gestionnaires des objets dont ils assurent la diffusion, des caches
<Desc/Clms Page number 2>
Figure img00020001

implantés dans des serveurs dits de procuration ou proxies. On désignera ce type de dispositif, bien connu, par le terme proxy cache. Sur requête HTTP d'accès à un objet par un terminal utilisateur, un proxy cache associé peut renvoyer directement l'objet s'il est contenu dans le cache du fait d'une requête antérieure identique. Sinon, un message de requête HTTP est envoyé du proxy cache vers le serveur d'origine hébergeant l'URL pour transmission de l'objet à l'utilisateur. Au passage, le proxy cache effectue indexation et stockage de l'objet. Un des avantages du cache est de rapprocher une information de l'utilisateur. L'utilisation d'un proxy cache se traduit par un gain en temps de réponse, et éventuellement en coût si le transfert en provenance du serveur original a un certain coût.
Une autre solution au problème de la rapidité d'accès aux données consiste à reproduire le contenu du serveur d'origine sur d'autres serveurs appelés miroirs. Est ainsi évitée une concentration de connexions sur le serveur d'origine.
Un autre problème à résoudre dans ce domaine technique concerne la sélectivité de l'accès aux données, impliquant une assistance automatique à l'utilisateur permettant d'affiner sa recherche d'information.
Les moteurs de recherche sont des dispositifs bien connus permettant à un utilisateur de rechercher de l'information localisée sur le Web. Ils fournissent à un utilisateur des pointeurs vers ces contenus.
Les différents dispositifs et procédés qui viennent d'être évoqués n'offrent pas, individuellement, de solution aux deux problèmes de la rapidité d'accès aux données et de la sélectivité de l'accès à ces données et présentent en outre d'autres problèmes.
Le cache ne garde les objets qu'un temps déterminé, contrôlé par un algorithme fonction, par exemple, de la date d'entrée, de la taille, de l'historique d'accès.
Souvent, les caches sont configurés pour ne stocker que les objets de taille pas trop importante. Par principe, si un objet n'est pas redemandé rapidement, il est éliminé du cache pour faire place à des objets plus récents. Dans l'exemple d'un proxy cache associé à un site d'entreprise, la durée de vie moyenne d'un document n'est que de quelques jours sauf s'il est très souvent demandé. Le cache est un composant au comportement probabiliste et, en conséquence, il est difficile de maîtriser la nature et la durée de vie de son contenu.
Contrairement aux caches, le contenu des miroirs est déterminé.
L'administrateur doit prendre l'initiative de la copie d'information, ce qui fait qu'il maîtrise tous les paramètres liés au contenu, comme la durée de vie, la quantité
<Desc/Clms Page number 3>
copiée, la localisation etc. La gestion des sites miroirs est souvent de type systématique. Elle implique généralement des organisations identiques des contenus
Autrement dit, un tel système ne dispose d'aucune autonomie en ce qui concerne la constitution du contenu accessible par l'utilisateur final.
Les moteurs de recherche ne font que fournir des pointeurs vers une information. Ils imposent donc une connexion au serveur d'origine pour récupérer l'information.
Un système connu, le CDN (pour content delivery network), est une version améliorée des miroirs dont il pallie un certain nombre de lacunes. Il se fonde sur une architecture distribuée de composants de stockage comme des miroirs ou des caches.
Il vise à combiner certains avantages des caches et des miroirs. La copie de l'information depuis le serveur d'origine sur les composants de stockage peut se faire avec une certaine autonomie. En revanche, cette autonomie n'existe pas dans la constitution du contenu : le système de CDN ne fait que répliquer l'organisation et les contenus des serveurs d'origine.
Dans certains des dispositifs et procédés précédents, l'opération de copie est réalisée de manière manuelle. Lorsque la copie n'est pas réalisée sur l'initiative du possesseur de l'information, ce dernier n'a pas de retour sur le nombre de consultations. Ceci est un sérieux inconvénient dans le cas où le possesseur de l'information est rémunéré par le nombre d'accès.
La présente invention a comme objectif de proposer un système, venant s'ajouter à l'éventail des solutions existantes pour améliorer la rapidité et la sélectivité d'accès aux données sur un réseau de télécommunication, qui permettrait de surmonter les problèmes précédemment évoqués.
A cet effet, elle propose un procédé de réutilisation d'information antérieurement reçue par un élément destinataire auquel est associé un moyen de stockage intermédiaire, au sein d'un réseau de télécommunication, ledit moyen de stockage intermédiaire étant adapté à stocker temporairement de l'information constitutive d'objets transmis audit élément destinataire consécutivement à des requêtes successives dudit élément destinataire, ledit procédé étant caractérisé en ce qu'il comprend des étapes consistant à : copier tous les objets contenus dans ledit moyen de stockage intermédiaire qui satisfont à des critères prédéterminés, et
<Desc/Clms Page number 4>
stocker avec indexation appropriée les copies effectuées desdits objets dans un moyen de gestion d'objets associé audit élément destinataire.
Le moyen de stockage intermédiaire, par exemple un proxy cache, emmagasinant tous les objets transmis à l'élément destinataire, par exemple un site d'entreprise, tous les objets satisfaisant à des critères prédéterminés, par exemple tous les objets de grande taille, ayant été transmis au moins une fois vers le site seront stockés dans le moyen de gestion d'objets, par exemple un serveur Web. Cette opération permettant le rapprochement de certains objets ciblés permet une augmentation de la rapidité d'accès aux données et une meilleure sélectivité. Le contenu du moyen de gestion d'objets, par exemple un serveur Web, va être constitué de manière autonome, en fonction des demandes effectuées par les utilisateurs destinataires, par exemple les utilisateurs d'un site d'entreprise. La constitution du contenu de ce serveur Web est généralement conforme aux centres d'intérêts du site puisqu'elle se fait en fonction des demandes des utilisateurs de ce site. Or, un objet demandé par un utilisateur du site a de grandes chances d'intéresser un autre utilisateur de ce site. La durée de vie des objets contenus dans ce moyen de gestion d'objets, par exemple un serveur Web, peut également être gérée de manière autonome, indépendamment des impératifs particuliers propres au moyen de stockage intermédiaire, par exemple un proxy cache.
Avantageusement, ladite étape consistant à copier tous les objets contenus dans ledit moyen de stockage intermédiaire qui satisfont à des critères prédéterminés ne copie que les objets qui sont supérieurs à une taille prédéterminée.
Contrairement à ce qui se passe dans un cache, le coût du stockage est considéré comme étant moins lourd à supporter que celui de l'organisation de la gestion des copies. Il n'est donc pas intéressant de copier des objets de petite taille puisque, d'une part, ces derniers peuvent être rapatriés relativement rapidement depuis le serveur d'origine et, d'autre part, ils sont difficiles à gérer car trop nombreux.
Selon un autre aspect de la présente invention, ladite étape consistant à copier tous les objets contenus dans ledit moyen de stockage intermédiaire qui satisfont à des critères prédéterminés ne copie que les objets autonomes et facilement réutilisables en l'état.
Par exemple, dans le cas du Web, les fichiers peu autonomes ou difficilement réutilisables en l'état comme les fichiers ca ne sont pas copiés.
<Desc/Clms Page number 5>
Selon un autre aspect de la présente invention, ladite étape consistant à copier tous les objets contenus dans ledit moyen de stockage intermédiaire qui satisfont à des critères prédéterminés ne copie que les objets cohérents avec des centres d'intérêts associés à l'élément destinataire.
La cohérence des objets avec des centres d'intérêts associés à l'élément destinataire, par exemple un site d'entreprise, peut tout d'abord être mesurée à partir du nombre de fois où un objet donné a été demandé sur le réseau. Ensuite, cette cohérence peut être mesurée à partir du niveau de proximité thématique d'un objet donné par rapport aux accès globaux et/ou par rapport aux accès au moyen de gestion d'objets.
Selon un autre aspect de la présente invention, le procédé comprend également des étapes consistant à : générer automatiquement des fichiers contenant des liens vers lesdits objets stockés dans ledit moyen de gestion d'objets, et stocker avec indexation appropriée lesdits fichiers dans ledit moyen de gestion d'objets.
De tels fichiers, par exemple des pages HTML, peuvent contenir, en plus des liens vers les objets, des descriptifs de ces objets.
Avantageusement, ladite étape consistant à stocker avec indexation appropriée lesdits fichiers dans ledit moyen de gestion d'objet effectue automatiquement un classement desdits fichiers selon une hiérarchie thématique.
Avantageusement, lesdits fichiers sont accessibles au moyen d'une recherche par mots clés.
Selon un autre aspect de la présente invention, ladite étape consistant à copier tous les objets contenus dans ledit moyen de stockage intermédiaire qui satisfont à des critères prédéterminés copie en même temps que chaque objet des éléments formant un contexte dans lequel est pris ledit objet, ladite étape consistant à générer automatiquement des fichiers contenant des liens vers lesdits objets stockés dans ledit moyen de gestion d'objets associant lesdits éléments au fichier contenant un lien vers ledit objet.
Un tel élément formant un contexte dans lequel est pris un objet est par exemple une page Web contenant un lien avec l'objet et une description textuelle de cet objet.
Le fichier généré sera alors également une page Web établie à partir de la page Web
<Desc/Clms Page number 6>
récupérée. Est ainsi automatiquement généré un environnement de pages Web thématiquement cohérent avec les objets copiés.
Selon un autre aspect de la présente invention, ledit procédé comprend une étape de gestion de la durée de vie des objets contenus dans ledit moyen de gestion d'objets, consistant à éliminer dudit moyen de gestion d'objets un objet qui, après un intervalle de temps donné, n'a pas satisfait à des critères prédéterminés.
Les critères en question peuvent être le nombre d'accès à cet objet, l'existence de cet objet sur le serveur d'origine ou la conformité aux centres d'intérêts de l'élément destinataire.
Avantageusement, ledit moyen de gestion d'objets est un serveur Web HTTP accessible via un navigateur standard.
Ainsi, du point de vue d'un utilisateur, tout se passe comme si l'information susceptible de l'intéresser était disponible au sein d'un même serveur accessible de manière traditionnelle, ce serveur étant local et permettant donc un accès rapide aux données.
Selon un autre aspect de la présente invention, un dispositif pour exécuter un procédé de réutilisation d'information antérieurement reçue par un élément destinataire au sein du réseau Internet, comprend un proxy cache, un serveur Web et un système de réplication autonome comprenant un étage d'analyse d'opportunité, un étage de reconstitution associative, un étage de génération de contenu et un étage de gestion du contenu.
Les caractéristiques de l'invention mentionnées ci-dessus, ainsi que d'autres apparaîtront plus clairement à la lecture de la description suivante d'un exemple de réalisation, ladite description étant faite en relation avec la Fig. unique représentant un organigramme montrant de manière schématique le fonctionnement d'un dispositif selon la présente invention et appliquant un procédé selon la présente invention.
En référence à la Fig. unique, un dispositif 1 de réutilisation d'information selon un exemple de réalisation de la présente invention s'applique à un site Web, par exemple un site d'entreprise, désigné dans ce qui suit par le terme site destinataire. Bien entendu, l'invention pourrait s'adapter également à tout autre contexte d'accès à Internet, par exemple un accès par le biais d'un fournisseur de services Internet (ISP)
Au site destinataire est associé, de manière classique, un proxy cache 10. Il pourra par exemple s'agir d'un proxy cache de type Squid appartenant au domaine public. Un tel proxy cache comprend un disque de stockage 11. Son fonctionnement
<Desc/Clms Page number 7>
Figure img00070001

est assuré par une unité de commande 13. Sont également associés au proxy cache 10 des fichiers de trace informatique ou fichiers de Log 12. Classiquement, sur requête HTTP d'accès à un objet à partir du site destinataire, le proxy cache peut renvoyer directement l'objet s'il est contenu dans le cache du fait d'une requête antérieure identique. Sinon, un message de requête HTTP est envoyé du proxy cache vers le serveur d'origine hébergeant l'URL pour transmission de l'objet à l'utilisateur. Au passage, le proxy cache effectue indexation et stockage de l'objet. Le stockage des objets dans le disque 11 est un stockage temporaire. Chaque objet n'est stocké que pour un temps déterminé, contrôlé par un algorithme fonction, par exemple, de la date d'entrée et de la taille de l'objet.
Selon l'invention, le contenu du proxy cache 10 est analysé pour détecter la présence d'objets lourds, et, le cas échéants, déterminer les caractéristiques de ces objets afin d'évaluer l'opportunité de les copier sur un moyen de gestion d'objets. Par objets lourds on entend des objets ayant une taille supérieure à une taille limite prédéterminée, par exemple 100 ko. L'analyse est faite régulièrement, à intervalle fonction de la durée de vie moyenne des objets sur le proxy cache, afin que soient copiés dans le moyen de gestion tous les objets satisfaisant les critères d'opportunité.
A cet effet, le dispositif de réutilisation de l'information 1 comprend, outre le proxy cache 10, un système de réplication autonome 20 et un serveur Web HTTP 30.
Le serveur Web 30, formant moyen de gestion, est un serveur de type classique, par exemple de type Apache appartenant au domaine public, local au site destinataire.
Un tel serveur comprend un disque de stockage 31 et une unité de commande 33. Un tel serveur est accessible via un navigateur standard. Le contenu de ce serveur Web, ainsi qu'il apparaîtra mieux par la suite, est constitué de pages 32 automatiquement générées par le système ainsi que par des objets lourds recopiés depuis le cache sur un disque 31.
Le système de réplication autonome 20, implanté sur le site destinataire, comprend quatre étages, un étage d'analyse d'opportunité 21, un étage de reconstitution associative 22, un étage de génération de contenu 23 et un gestionnaire de contenu 24.
L'étage d'analyse d'opportunité 21 a pour fonction d'analyser l'opportunité
Figure img00070002

d'effectuer une copie d'un objet contenu dans le disque 11 associé au proxy cache 10 vers le disque 31 associé au serveur Web 30 formant moyen de gestion. Pour ce faire, sont employés des critères d'opportunité Ces critères s'appliquent après recoupement
<Desc/Clms Page number 8>
entre fichiers de Log de manière à ne prendre en compte que les objets effectivement présents dans le cache.
Un premier critère d'opportunité appliqué est celui lié à la taille de l'objet. Seuls les objets de grande taille, par exemple supérieure à 100 ko, sont copiés.
Un second critère d'opportunité appliqué est celui lié à la réutilisabilité de l'objet. Les objets peu autonomes ou difficilement réutilisables en l'état, comme les
Figure img00080001

fichiers cla ne sont pas copiés. On ne copie donc que des objets de type classique comme les fichiers . mp3 , . mpg , . doc , . avi , jpg , etc.
Un troisième critère d'opportunité appliqué est celui lié à la cohérence avec les centres d'intérêt des utilisateurs du site destinataire. Cette cohérence peut tout d'abord être mesurée à partir du nombre de fois où un objet donné a été demandé sur le réseau, ce nombre étant révélé par l'analyse des fichiers de Log 12. Ensuite, cette cohérence peut être mesurée à partir du niveau de proximité thématique d'un objet donné par rapport aux accès globaux et par rapport aux accès au serveur Web 30. Les niveaux de proximité thématique sont mesurés de manière connue grâce à un moteur d'analyse sémantique.
L'étage de reconstitution associative 22 a pour fonction de réunir des éléments formant un contexte dans lequel est pris un objet à copier. Cet étage procède à l'analyse de la page Web dans laquelle se trouve le lien vers l'objet considéré. Les éléments de contexte jugés importants sont récupérés. Par exemple, on peut récupérer une page Web contenant un lien vers un fichier compressé ( . zip ), ce qui permet d'avoir une description textuelle de l'objet. Dans certains cas, sont récupérés des éléments correspondants à un niveau supérieur de l'arborescence hyper-text pour obtenir une description plus approfondie. Par exemple, on peut récupérer la page contenant un lien vers la page contenant un lien vers l'objet.
L'étage de génération de contenu 23 a pour fonction d'effectuer la copie dans le disque 31 des objets sélectionnés par l'étage 21, et, en parallèle, de générer une arborescence de pages Web 32 contenant des liens vers les objets copiés et décrivant ces derniers. L'arborescence de pages Web est présentée par exemple selon le formalisme de Dewey Ce formalisme présente une structure hiérarchisée de thèmes en relation sémantique. Les pages qui correspondent à ces thèmes sont accessibles par des liens sur des pages qui correspondent à d'autres thèmes sémantiquement liés. Sont associés aux noeuds ou feuilles de l'arborescence des pages automatiquement générées contenant des liens vers les objets copiés et les pages Web formant les éléments
<Desc/Clms Page number 9>
Figure img00090001

contextuels récupérés sur le cache par l'étage 22. Ainsi qu'il est décrit dans le document Distributed Multimedia document Modeling par Luigi Lancieri, dans Proceedings of IEEE Joint Conference on Neural Networks , 1998, un réseau sémantique est utilisé pour mesurer la distance entre une page Web formant élément contextuel et chaque noeud de l'arborescence. La page Web avec son lien vers l'objet correspondant est placée au niveau du noeud de l'arborescence pour lequel la distance sémantique est la plus courte. A chaque fois qu'un objet est ajouté au serveur, les pages et les liens sont modifiés en conséquence. La génération de pages peut être faite de manière dynamique pour un accès statique ou à la demande par un programme de type CGI (pour Gateway Common Interface) ou tous types de formation de réponse dynamique. La copie des objets entre le disque 11 du cache 10 et le disque 31 du serveur 30 implique un traitement spécial sur le fichier de type MIME (pour Multipurpose Internet Mail Extension) correspondant et en particulier l'élimination de l'en-tête spécial généré par le cache.
Du point de vue d'un utilisateur, l'interface est semblable à ce qui existe sur un moteur de recherche ou un catalogue de type classique. Le contenu pourra également être accessible par mots clés. Le contenu visible par chaque utilisateur pourra être personnalisé par détection automatique du profil de chaque utilisateur, ainsi qu'il est décrit dans le document Distributed Multimedia document Modeling précité, par opération manuelle, chaque utilisateur donnant des mots clés caractéristiques de son profil, ou par une combinaison des deux méthodes.
Les étapes de copie et de stockage exécutées par les étages 21,22 et 23 sont effectuées à un rythme adapté à la durée de vie moyenne des objets dans le cache.
L'étage de gestion des contenus 24 a pour fonction de gérer la durée de vie des objets selon des modalités prédéterminées. D'une part, il détermine, par l'envoi de la requête HTTP correspondante, si un objet reste ou non présent sur le serveur d'origine. D'autre part, il mesure le nombre d'accès à l'objet en question. Ce nombre d'accès va servir de critère permettant de déterminer si l'objet doit être ou non éliminé du serveur Web 30 formant moyen de gestion.
Dans le présent système, la taille disque est élevée comparée aux système de l'art antérieur, ce qui donne aux objets stockés une durée de vie minimum de une à. deux semaines. Un objet est éliminé au bout de ce laps de temps s'il conjugue plusieurs facteurs défavorables, par exemple s'il n'a jamais été accédé, s'il n'existe plus sur le serveur d'origine et s'il est éloigné des centres d'intérêt du site destinataire

Claims (12)

  1. REVENDICATIONS 1) Procédé de réutilisation d'information antérieurement reçue par un élément destinataire auquel est associé un moyen de stockage intermédiaire (10), au sein d'un réseau de télécommunication, ledit moyen de stockage intermédiaire (10) étant adapté à stocker temporairement de l'information constitutive d'objets transmis audit élément destinataire consécutivement à des requêtes successives dudit élément destinataire, ledit procédé étant caractérisé en ce qu'il comprend des étapes consistant à : copier tous les objets contenus dans ledit moyen de stockage intermédiaire (10) qui satisfont à des critères prédéterminés, et stocker avec indexation appropriée les copies effectuées desdits objets dans un moyen de gestion d'objets (30) associé audit élément destinataire.
  2. 2) Procédé selon la revendication 1, caractérisé en ce que ladite étape consistant à copier tous les objets contenus dans ledit moyen de stockage intermédiaire (10) qui satisfont à des critères prédéterminés ne copie que les objets qui sont supérieurs à une taille prédéterminée.
  3. 3) Procédé selon la revendication 1 ou 2, caractérisé en ce que ladite étape consistant à copier tous les objets contenus dans ledit moyen de stockage intermédiaire (10) qui satisfont à des critères prédéterminés ne copie que les objets autonomes et facilement réutilisables en l'état.
  4. 4) Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que ladite étape consistant à copier tous les objets contenus dans ledit moyen de stockage intermédiaire (10) qui satisfont à des critères prédéterminés ne copie que les objets cohérents avec des centres d'intérêts associés audit élément destinataire.
  5. 5) Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce qu'il comprend également des étapes consistant à : générer automatiquement des fichiers (32) contenant des liens vers lesdits objets stockés dans ledit moyen de gestion d'objets (30), et stocker avec indexation appropriée lesdits fichiers dans ledit moyen de gestion d'objets.
  6. 6) Procédé selon la revendication 5, caractérisé en ce que ladite étape consistant à stocker avec indexation appropriée lesdits fichiers (32) dans ledit moyen de gestion d'objet (30) effectue automatiquement un classement desdits fichiers selon une hiérarchie thématique
    <Desc/Clms Page number 11>
  7. 7) Procédé selon la revendication 5 ou 6, caractérisé en ce que lesdits fichiers (32) sont accessibles au moyen d'une recherche par mots clés.
  8. 8) Procédé selon l'une quelconque des revendications 5 à 7, caractérisé en ce que ladite étape consistant à copier tous les objets contenus dans ledit moyen de stockage intermédiaire (10) qui satisfont à des critères prédéterminés copie en même temps que chaque objet des éléments formant un contexte dans lequel est pris ledit objet.
  9. 9) Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que ledit procédé comprend une étape de gestion de la durée de vie des objets contenus dans ledit moyen de gestion d'objets (30), consistant à éliminer dudit moyen de gestion d'objets un objet qui, après un intervalle de temps donné, n'a pas satisfait à des critères prédéterminés.
  10. 10) Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que ledit moyen de gestion d'objets (30) est un serveur Web HTTP accessible via un navigateur standard.
  11. 11) Dispositif pour exécuter un procédé de réutilisation d'information antérieurement reçue par un élément destinataire au sein du réseau Internet selon l'une quelconque des revendications précédentes, ledit dispositif (1) étant caractérisé en ce qu'il comprend un proxy cache (10), un serveur Web (30) et un système de réplication autonome (20) comprenant un étage d'analyse d'opportunité (21), un étage de reconstitution associative (22), un étage de génération de contenu (23) et un étage de gestion du contenu (24).
  12. 12) Dispositif de réplication autonome (20) destiné à être associé à un proxy cache (10) et un serveur Web (30) pour exécuter un procédé de réutilisation d'information antérieurement reçue par un élément destinataire au sein du réseau Internet selon l'une quelconque des revendications 1 à 10, ledit dispositif (20) étant caractérisé en ce qu'il comprend un étage d'analyse d'opportunité (21), un étage de reconstitution associative (22), un étage de génération de contenu (23) et un étage de gestion de contenu (24).
FR0013419A 2000-10-17 2000-10-17 Procede et dispositif de reutilisation d'information ayant fait l'objet d'une reception anterieure dans un reseau de telecommunication tel que le reseau internet Withdrawn FR2815435A1 (fr)

Priority Applications (6)

Application Number Priority Date Filing Date Title
FR0013419A FR2815435A1 (fr) 2000-10-17 2000-10-17 Procede et dispositif de reutilisation d'information ayant fait l'objet d'une reception anterieure dans un reseau de telecommunication tel que le reseau internet
PCT/FR2001/003196 WO2002033588A1 (fr) 2000-10-17 2001-10-16 Procede et dispositif de reutilisation d'information ayant fait l'objet d'une reception anterieure dans un reseau de telecommunication tel que le reseau internet
AU2002210645A AU2002210645A1 (en) 2000-10-17 2001-10-16 Method and device for re-using information previously received in a telecommunication network such as internet
US10/399,370 US20040014469A1 (en) 2000-10-17 2001-10-16 Method and device or re-using information received previously in a telecommunication network such as the internet
CNA018189067A CN1527977A (zh) 2000-10-17 2001-10-16 重新使用在通信网络如互联网中预先接收的信息的方法和装置
EP20010978539 EP1328879A1 (fr) 2000-10-17 2001-10-16 Procede et dispositif de reutilisation d'information ayant fait l'objet d'une reception anterieure dans un reseau de telecommunication tel que le reseau internet

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0013419A FR2815435A1 (fr) 2000-10-17 2000-10-17 Procede et dispositif de reutilisation d'information ayant fait l'objet d'une reception anterieure dans un reseau de telecommunication tel que le reseau internet

Publications (1)

Publication Number Publication Date
FR2815435A1 true FR2815435A1 (fr) 2002-04-19

Family

ID=8855531

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0013419A Withdrawn FR2815435A1 (fr) 2000-10-17 2000-10-17 Procede et dispositif de reutilisation d'information ayant fait l'objet d'une reception anterieure dans un reseau de telecommunication tel que le reseau internet

Country Status (6)

Country Link
US (1) US20040014469A1 (fr)
EP (1) EP1328879A1 (fr)
CN (1) CN1527977A (fr)
AU (1) AU2002210645A1 (fr)
FR (1) FR2815435A1 (fr)
WO (1) WO2002033588A1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1492029A1 (fr) * 2003-06-23 2004-12-29 France Telecom Procédé et dispositif de traitement d'informations ayant fait l'objet d'une réception antérieure dans un réseau de télécommunication tel que le réseau Internet

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7251649B2 (en) * 2003-10-31 2007-07-31 Hewlett-Packard Development Company, L.P. Method for prioritizing content
FR2926905B1 (fr) * 2008-01-24 2010-03-26 Streamezzo Procede d'alimentation d'un mandataire de contenu multimedia, mandataire, et produit programme d'ordinateur correspondant

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999003047A1 (fr) * 1997-07-11 1999-01-21 Earle Machardy Systeme d'environnement d'accueil de contenus et mecanisme cache
EP1028551A2 (fr) * 1999-01-27 2000-08-16 Hughes Electronics Corporation Interface utilisateur graphique, utilisant un ordinateur, pour le traitement de données audiovisuelles et méthode pour le traitement des données audiovisuelles

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6742047B1 (en) * 1997-03-27 2004-05-25 Intel Corporation Method and apparatus for dynamically filtering network content
US6081840A (en) * 1997-10-14 2000-06-27 Zhao; Yan Two-level content distribution system
US6453420B1 (en) * 1999-04-21 2002-09-17 Research Investment Network, Inc. System, method and article of manufacture for authorizing the use of electronic content utilizing a laser-centric medium

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999003047A1 (fr) * 1997-07-11 1999-01-21 Earle Machardy Systeme d'environnement d'accueil de contenus et mecanisme cache
EP1028551A2 (fr) * 1999-01-27 2000-08-16 Hughes Electronics Corporation Interface utilisateur graphique, utilisant un ordinateur, pour le traitement de données audiovisuelles et méthode pour le traitement des données audiovisuelles

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BRADFORD C ET AL: "A bandwidth friendly search engine", PROCEEDINGS IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA COMPUTING AND SYSTEMS, PROCEEDINGS OF ICMCS99: IEEE MULTIMEDIA SYSTEMS '99: INTERNATIONAL CONFERENCE ON MULTIMEDIA COMPUTING AND SYSTEMS, FLORENCE, ITALY, 7-11 JUNE 1999, 1999, Los Alamitos, CA, USA, IEEE Comput. Soc, USA, pages 720 - 724 vol.2, XP002178578, ISBN: 0-7695-0253-9 *
DODGE C ET AL: "WEB CATALOGUING THROUGH CACHE EXPLOITATION AND STEPS TOWARD CONSISTENCY MAINTENANCE", COMPUTER NETWORKS AND ISDN SYSTEMS, NORTH HOLLAND PUBLISHING. AMSTERDAM, NL, vol. 27, no. 6, 1 April 1995 (1995-04-01), pages 1003 - 1008, XP000647241, ISSN: 0169-7552 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1492029A1 (fr) * 2003-06-23 2004-12-29 France Telecom Procédé et dispositif de traitement d'informations ayant fait l'objet d'une réception antérieure dans un réseau de télécommunication tel que le réseau Internet

Also Published As

Publication number Publication date
AU2002210645A1 (en) 2002-04-29
US20040014469A1 (en) 2004-01-22
CN1527977A (zh) 2004-09-08
EP1328879A1 (fr) 2003-07-23
WO2002033588A1 (fr) 2002-04-25

Similar Documents

Publication Publication Date Title
US8032527B2 (en) Search filtering
US8538921B2 (en) File caching
WO2006111452A1 (fr) Procédé d&#39;optimisation de la gestion d&#39;un cache de serveur pouvant être consulté par des terminaux clients de caractéristiques différentes
EP2105002A2 (fr) Systeme et procede de traçabilite de contenus sur internet
US20190286726A1 (en) Automatic Updates for a Virtual Index Server
FR2979509A1 (fr) Procede et serveur pour le suivi des utilisateurs au cours de leur navigation dans un reseau de communication
FR3043817A1 (fr) Procede de recherche d’informations au sein d’un ensemble d’informations
US20190286735A1 (en) Construction and Use of a Virtual Index Server
FR2818475A1 (fr) Systeme de distribution selective de fichiers electroniques via une plate-forme d&#39;acces commune
WO2009121808A1 (fr) Procede de gestion de messages electroniques a partir d&#39;un client de messagerie et systeme pour mettre en oeuvre le procede
FR2815435A1 (fr) Procede et dispositif de reutilisation d&#39;information ayant fait l&#39;objet d&#39;une reception anterieure dans un reseau de telecommunication tel que le reseau internet
FR3042624A1 (fr) Procede d&#39;aide a la detection d&#39;infection d&#39;un terminal par un logiciel malveillant
AlSum Web archive services framework for tighter integration between the past and present web
EP1515522A1 (fr) Procédé d&#39;insertion d&#39;informations de filtrage thématique de pages HTML et système correspondant
US10896240B2 (en) Data analytics via a virtual index server
EP1492029A1 (fr) Procédé et dispositif de traitement d&#39;informations ayant fait l&#39;objet d&#39;une réception antérieure dans un réseau de télécommunication tel que le réseau Internet
FR2811494A1 (fr) Dispositif de gestion d&#39;acces a des donnees d&#39;un reseau et installation de telecommunication et procede associes
FR2853788A1 (fr) Procede et dispositif d&#39;acces a un document numerique dans un reseau de communication du type poste a poste
EP1431888A1 (fr) Procédé et système d&#39;indexation de pages WEB
EP2472818B1 (fr) Procédé de traitement de données pour contrôler l&#39;accès à des contenus sur Internet.
FR2858078A1 (fr) Procede de navigation pour le prechargement, serveur, unite de programmes d&#39;ordinateur pour mettre en oeuvre le procede
WO2000052599A1 (fr) Procede et systeme de telecommunication
FR3038092A1 (fr) Procede de telechargement accelere d&#39;une page web vers un terminal de communication
FR2902907A1 (fr) Procede de recherche d&#39;informations sur un reseau intranet, extranet, internet ou toute autre source de diffusion d&#39;informations numeriques et moteur de recherche pour la mise en oeuvre dudit procede
EP2043007A1 (fr) Procédé de recherche d&#39;informations sur un réseau intranet, extranet, internet ou toute autre source de diffusion d&#39;informations numériques et moteur de recherche pour la mise en oeuvre dudit procédé

Legal Events

Date Code Title Description
ST Notification of lapse
RN Application for restoration
FC Decision of inpi director general to approve request for restoration