WO2006032671A1 - Procede et systeme exploitant le codage de cookie pour repartir des informations relatives a des internautes - Google Patents

Procede et systeme exploitant le codage de cookie pour repartir des informations relatives a des internautes Download PDF

Info

Publication number
WO2006032671A1
WO2006032671A1 PCT/EP2005/054712 EP2005054712W WO2006032671A1 WO 2006032671 A1 WO2006032671 A1 WO 2006032671A1 EP 2005054712 W EP2005054712 W EP 2005054712W WO 2006032671 A1 WO2006032671 A1 WO 2006032671A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
identifier
character
navigation information
given
Prior art date
Application number
PCT/EP2005/054712
Other languages
English (en)
Inventor
Sunny Paris
Original Assignee
Weborama
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Weborama filed Critical Weborama
Priority to EP05784556A priority Critical patent/EP1807778A1/fr
Priority to US11/663,291 priority patent/US20080177762A1/en
Publication of WO2006032671A1 publication Critical patent/WO2006032671A1/fr

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management

Definitions

  • the invention relates to a method and a system for efficiently storing, particularly with a view to subsequent access or processing, information relating to the navigation of a large number of users of a communication network.
  • the invention is of particular interest for the development of behavioral profiles of Internet users or any other communication network, as well as for the display of digital advertising messages based in particular on the history of messages already viewed.
  • the Internet is an open network on which a large number of users circulate. In order to display the right message to the right person at a given time, it is very important to be able to access in a very short time information about this user.
  • This information can be a pre-calculated profile, a complete browsing history on a set of sites of interest or a list of advertising messages already viewed by the user.
  • the present invention provides a solution for simply managing a very large number of users (several billion for example).
  • Web of interest or when it is exposed to an advertising message, it triggers the successive sending of requests to a system such as for example a behavioral profiling system, a system of audience measurement, or a system of advertising broadcast.
  • a system such as for example a behavioral profiling system, a system of audience measurement, or a system of advertising broadcast.
  • This browsing information typically includes the user's identifier, the site identifier or the advertising message, the date, the time and the browser language, the part of the site actually visited.
  • the identifier of the user is usually a unique identifier stored in a cookie (or cookie) installed on the browser of the user.
  • This cookie is for example installed on the navigation station of the user (a unique identifier is then assigned to the user) during the first visit of it on one of the sites of interest.
  • the navigation information is typically recorded by the profiling system in storage means and constitute the browsing history of the user to be identified.
  • the profiling system can determine a statistical profile of the user.
  • the flow of data collected by the profiling or advertising distribution system i.e. browsing information of Internet users
  • the flow of data collected by the profiling or advertising distribution system is particularly important. For example, when approximately 20,000 French sites of interest are audited, over 10 Giga Bytes of navigation information are collected each day.
  • the mass of information is constantly increasing.
  • a profiling or dissemination system of the type presented above must be able to respond to a certain number of constraints. In particular, it must be able to cover a large audience of Internet users, to be able to react in real time to send a user's profile to an applicant's site and to be very stable.
  • the computer means used including storage means and browsing information processing servers
  • the computer means used are able to access the stored information, process it and send it back in a minimum of time, and this while ensuring the continuity of service provided by the profiling or dissemination system. It is conceivable that such a system is inoperative if the profile of a user is returned to a web server in too much time.
  • the invention proposes, according to a first aspect, a method for storing navigation information of a set of users of a communication network on a set of sites of interest accessible by the network, in storage means connected to the network, comprising the step of, for each site of the set of sites of interest, to transmit to the storage means the navigation information of a user connecting to said site, said navigation information comprising a unique identifier of the user consisting of a plurality of characters, stored in a cookie installed on the user's navigation station, the method being characterized in that it comprises the step of storing the information of navigation of said user in a database of a set, forming said storage means, databases separate from each other, the choice of the database being r Alisé depending on the value of a given character of the identifier of said user.
  • Preferred but not limiting aspects of the method according to the first aspect of the invention are the following: the choice of the database can be made according to a given character of the identifier such that the distribution of the users is homogeneous over all the values that this character can take;
  • the storage step may furthermore comprise, for each database, storing the navigation information of said user in a data table of a set, forming said database, of data tables distinct from one another the choice of the data table being made according to the value of a given second character of the identifier of said user; the choice of the data table can be made according to a given second character of the identifier such that the distribution of the users is homogeneous over all the values that this character can take;
  • the storage step can further consist in storing the navigation information of a user in at least one computer equipment, each equipment hosting a set of databases forming storage means, the choice of a device being made in depending on the value of a given third character of the user's identifier;
  • the choice of the equipment can be made according to a character of the identifier such that the distribution of the users is homogeneous over all the values that this character can take;
  • the navigation information of the user can be stored in a data table of a database hosted by a device, the choice of said equipment, base and table being made according to the first three characters of the identifier said identifier having twelve characters according to a base number system 64.
  • the invention proposes a navigation information storage system of a set of users of a communication network on a set of sites of interest accessible by the network, said system comprising means for storage connected to the network for storing the navigation information transmitted by each site of the set of sites of interest, when a user connects to said site, said navigation information comprising a unique identifier of the user consisting of a plurality of characters, stored in a cookie installed on the navigation station of the user, the system being characterized in that said storage means consist of a set of databases distinct from each other, the selection of a database for storing the navigation information relating to a user being made according to the value of a given character of the identifier of said user.
  • FIG. 1 is a representative diagram of a navigation information storage system according to a possible embodiment of the invention.
  • a profile determination system 400 is connected to a communication network 200 (such as the Internet) to which is connected a set 300 of web servers of interest 301, 302, 303.
  • Each web server hosts a site or digital content made available to the users 500 of the network 200 (the net surfers) by a service provider.
  • the profile generation system 400 comprises storage means 100, 110 connected to the network 200, and adapted to list information relating to the browsing of the Internet users 500 on the sites hosted by the web servers 301, 302, 303. As such previously mentioned, this navigation information is transmitted during a profile request sent by a Web server of interest 301 to the profiling system when a user visits the site.
  • This navigation information typically includes the user's identifier, the site identifier, the date, the time and the language of the browser, the part of the site actually visited.
  • the identifier of the user is usually a unique identifier stored in a cookie (or cookie) installed on the browser of the user.
  • This cookie is for example installed on the navigation station of the user (a unique identifier is then assigned to the user) during the first visit of it on one of the sites of interest.
  • the unique identifier associated with a user consists of a plurality of characters. Each character can take a number of different values, and this depending on the base of the selected numeral system.
  • the identifier comprises twelve characters, for example according to a base number system 64. Each character can thus take 64 different values.
  • the navigation information is distributed in a set, forming the storage means 100, 101-103 databases separate from each other, each database 101-103 storing the data.
  • this character is a character such that the distribution of Internet users is homogeneous (for example due to a random draw) on all the values that can take this character.
  • the probability that this given character of the identifier of a user has a particular value is thus the same whatever the value.
  • the manner in which the identifier assigned to a user is developed is advantageously exploited. In the context of an identifier comprising twelve characters, it is possible to develop a homogeneous distribution of users on certain characters, for example on the first and second characters.
  • the other characters of the identifier contain, as is customary, the elements necessary to ensure, preferably on their own, the uniqueness of the identifier. This is for example the date and time in seconds, the IP address of the server establishing the identifier, the PID (the English expression Process Identification Number for process identification number) of the process establishing the identifier, an incremental number, etc.
  • the netizens are thus distributed, according to the value taken by said given character of their identifier, in N groups of identical size.
  • the navigation information is thus stored in a homogeneous and particularly simple manner in N separate databases.
  • each of the databases 101-103; 111-113 consists of a set of data tables that are distinct from one another.
  • each data table stores the navigation information relating to the users having an identifier having, among the plurality of characters, a second identical given character or a second given character having a value among a set of values.
  • this second given character is here also a character such that the distribution of Internet users is homogeneous (for example due to a compulsory draw) on all the values that can take this character.
  • the Net surfers are thus distributed, according to the value taken by said first and second given characters of their identifier, in N * N groups of identical size.
  • the navigation information is thus stored in a homogeneous and particularly simple manner in N * N separate data tables.
  • said given first and second characters are respectively the first and the second characters of the identifier.
  • the storage system comprises a plurality of storage means 100, 110 of the type presented above.
  • the databases are hosted by a plurality of separate computer equipment, each computer equipment comprising means adapted to house a set of storage means in the sense of the present invention.
  • each piece of equipment accommodates a set of databases that are distinct from one another, each database storing the navigation information relating to the users having an identifier having, among the plurality of characters, an identical given character ( or a given character taking a value from a set of values).
  • a computer equipment 500 hosts the storage means 100 constituted by the 101-103 databases, while a device 510 hosts the storage means 110 constituted by the databases 111-113.
  • the navigation information is then distributed in such a way that each equipment stores the navigation information relating to the users having an identifier having, among the plurality of characters, a third identical given character (or a third given character having one of a set of values).
  • Internet users are then distributed in the databases according to said given first character of their identifier (for example the second character of the identifier), as well as, if applicable, in the data tables constituting a database according to said second identifier.
  • given character of their identifier for example the third character of the identifier.
  • said given third character (for a distribution between equipments) is a character of the identifier, for example a character in the header of said identifier.
  • a thirteenth character can be added in the header of the other twelve to allow the distribution between the different computer equipment.
  • the information concerning the user with the identifier SuNXXXXXXXXX can thus be stored on the equipment S, in the base u in the table N.
  • the browsing information relating to the internet users visiting one of the sites of interest is thus divided into 64 separate databases, each of these databases containing 64 data tables
  • the navigation information is distributed in 4096 different data tables, according to the values taken by said first and second given characters of the user's identifier.
  • the navigation information available to a given user is for example intended to be processed by a profiling system, in order to determine and update the profile of said user.
  • the profile thus determined is stored in the storage means according to the user distribution presented above.
  • the architecture presented here means of distributing the distribution of Internet users in structures (computer equipment, bases, tables) of separate data is therefore particularly interesting. In particular, it makes it possible to quickly access navigation information and profile data, to perform a parallel processing of the different data structures.
  • the invention is not limited to the particular embodiments which have just been described, but extends to any variant within its spirit. It will be understood in particular that the use of the invention is not limited to the framework of a method and profiling system.
  • the invention finds effect when information relating to users of a communication network having an identifier comprising a plurality of characters are to be stored and processed.
  • the invention can also be used for systems comprising Internet content content servers for which access to the profile and / or history of the user is very important.
  • the distribution of Internet users proposed by the invention makes it possible to perform a very simple and effective sampling for the purposes of provisional calculation or simulations.
  • the invention is also applicable in any system to process data of a very large number of identifiable objects, independently of each other.
  • the distribution of navigation information made by the invention also makes it possible to recover very quickly information on an object identified among a very large number of objects, and this without the need to make a request, necessarily long , in a "mega-database" of data.

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

Procédé de stockage d'informations de navigation d'un ensemble d'utilisateurs (500) d'un réseau de communication (200) sur un ensemble de sites d'intérêt (301-303) accessibles par le réseau, dans des moyens de stockage (100) reliés au réseau, comprenant l'étape consistant, pour chaque site de l'ensemble de sites d'intérêt, à transmettre aux moyens de stockage (100) les informations de navigation d'un utilisateur se connectant audit site, lesdites informations de navigation comprenant un identifiant unique de l'utilisateur constitué d'une pluralité de caractères, enregistré dans un cookie installé sur le poste de navigation de l'utilisateur, le procédé étant caractérisé en ce qu'il comporte l'étape consistant à stocker les informations de navigation dudit utilisateur dans une base de données d'un ensemble, formant lesdits moyensL' invention concer ne, selon un premier aspect, un procédé de stockage d'informations de navigation d'un ensemble d'utilisateurs (500) d'un réseau de communication (200) sur un ensemble de sites d'intérêt (301-303) accessibles par le réseau, dans des moyens de stockage (100) reliés au réseau, comprenant l'étape consistant, pour chaque site de l'ensemble de sites d'intérêt, à transmettre aux moyens de stockage (100) les informations de navigation d'un utilisateur se connectant audit site, lesdites informations de navigation comprenant un identifiant unique de l'utilis ateur constitué d'une pluralité de caractères, enregistré dans un cookie install é sur le poste de navigation de l'utilisateur, le procédé étant caractérisé en ce qu'il comporte l'étape consistant à stocker les informations de navigation dudit utilisateur dans une base de données d'un ensemble, formant lesdits moyens de stockage, de bases de données (101-103 ; 111-113) distinctes les unes des autres, le choix de la base de données étant réalisé en fonction de la valeur d'un caractère donné de l'identifiant dudit utilisateur.

Description

PROCEDE ET SYSTEME EXPLOITANT LE CODAGE DE COOKIE POUR REPARTIR DES INFORMATIONS RELATIVES A DES INTERNAUTES
L'invention concerne un procédé et un système permettant de stocker efficacement, notamment en vue d'un accès ou traitement subséquent, des informations relatives à la navigation d'un grand nombre d'utilisateurs d'un réseau de communication.
L'invention trouve tout particulièrement intérêt pour l'élaboration de profils comportementaux d'utilisateurs d'Internet ou de tout autre réseau de communication, ainsi que pour l'affichage de messages publicitaires numériques en fonction notamment de l'historique de messages déjà visualisés.
Le réseau Internet est un réseau ouvert sur lequel circule un très grand nombre d'utilisateurs. Afin d'afficher le bon message à la bonne personne à un moment donné, il est très important de pouvoir accéder en un temps très court à une information concernant cet utilisateur.
Cette information peut être un profil pre-calculé, un historique complet de navigation sur un ensemble de sites d'intérêts ou bien une liste de messages publicitaires déjà visualisés par l'internaute. La présente invention propose une solution permettant de gérer simplement un nombre très important d'utilisateurs (plusieurs milliards par exemple).
Lorsque l'internaute se connecte successivement à une série de sites
Web d'intérêt, ou lorsqu'il est exposé à un message publicitaire, il déclenche l'envoi successif de requêtes vers un système tel que par exemple un système de profiling comportemental, un système de mesure d'audience, ou encore un système de diffusion publicitaire.
Ces requêtes sont alors interprétées par le système comme une fourniture d'informations de navigation. Ces informations de navigation comprennent typiquement l'identifiant de l'internaute, l'identifiant du site ou du message publicitaire, la date, l'heure et la langue du navigateur, la partie du site effectivement visitée.
L'identifiant de l'internaute est généralement un identifiant unique enregistré dans un cookie (ou témoin de connexion) installé sur le poste de navigation de l'internaute.
Ce cookie est par exemple installé sur le poste de navigation de l'internaute (un identifiant unique étant alors attribué à l'internaute) lors de la première visite de celui-ci sur l'un des sites d'intérêt. Les informations de navigation sont typiquement enregistrées par le système de profiling dans des moyens de stockage et constituent l'historique de navigation de l'internaute à identifier.
C'est notamment à partir de cet historique que le système de profiling peut déterminer un profil statistique de l'internaute. Le flux de données recueillies par le système de profiling ou de diffusion publicitaire (i.e. informations de navigation des internautes) est particulièrement important. A titre d'exemple, lorsque 20 000 sites francophones d'intérêt environ sont ainsi audités, plus de 10 Giga Octets d'informations de navigation sont recueillies chaque jour. Par ailleurs, la masse d'informations est en constante augmentation.
Un système de profiling ou de diffusion du type présenté ci-dessus doit pouvoir répondre à un certain nombre de contraintes. Il doit en particulier être capable de couvrir une large audience d'internautes, de pouvoir réagir en temps réel pour renvoyer le profil d'un internaute à un site le requérant et d'être d'une grande stabilité.
Cela implique que les moyens informatiques utilisés (notamment moyens de stockage et serveurs de traitement des informations de navigation) soient aptes à accéder à l'information stockée, à la traiter et à la renvoyer en un minimum de temps, et cela tout en assurant la continuité de service fourni par le système de profiling ou de diffusion. On conçoit effectivement qu'un tel système est inopérant si le profil d'un internaute est renvoyé à un serveur Web dans un délai trop important.
On conçoit également que toute défaillance technique doit être évitée. L'interruption du service (c'est-à-dire lorsqu'un profil d'internaute n'est pas renvoyé à un serveur Web suite à une requête de celui-ci) fourni par le système de profiling est effectivement dommageable pour le fournisseur de service qui héberge le site Web. Ce dernier ne peut effectivement pas adapter dynamiquement le contenu numérique qu'il propose en fonction du profil de chaque internaute, et en optimiser ainsi l'efficacité. II existe donc un besoin pour une solution permettant de gérer les informations de navigation d'un nombre d'utilisateurs différents d'un réseau de communication particulièrement important, qui réponde aux contraintes mentionnées ci-dessus.
A cet effet, l'invention propose, selon un premier aspect, un procédé de stockage d'informations de navigation d'un ensemble d'utilisateurs d'un réseau de communication sur un ensemble de sites d'intérêt accessibles par le réseau, dans des moyens de stockage reliés au réseau, comprenant l'étape consistant, pour chaque site de l'ensemble de sites d'intérêt, à transmettre aux moyens de stockage les informations de navigation d'un utilisateur se connectant audit site, lesdites informations de navigation comprenant un identifiant unique de l'utilisateur constitué d'une pluralité de caractères, enregistré dans un cookie installé sur le poste de navigation de l'utilisateur, le procédé étant caractérisé en ce qu'il comporte l'étape consistant à stocker les informations de navigation dudit utilisateur dans une base de données d'un ensemble, formant lesdits moyens de stockage, de bases de données distinctes les unes des autres, le choix de la base de données étant réalisé en fonction de la valeur d'un caractère donné de l'identifiant dudit utilisateur.
Des aspects préférés, mais non limitatifs du procédé selon le premier aspect de l'invention sont les suivants : - le choix de la base de données peut être réalisé en fonction d'un caractère donné de l'identifiant tel que la répartition des utilisateurs est homogène sur l'ensemble des valeurs que peut prendre ce caractère ;
- l'étape de stockage peut consister en outre, pour chaque base de données, à stocker les informations de navigation dudit utilisateur dans une table de données d'un ensemble, formant ladite base de données, de tables de données distinctes les unes des autres, le choix de la table de données étant réalisé en fonction de la valeur d'un second caractère donné de l'identifiant dudit utilisateur ; - le choix de la table de données peut être réalisé en fonction d'un second caractère donné de l'identifiant tel que la répartition des utilisateurs est homogène sur l'ensemble des valeurs que peut prendre ce caractère ;
- l'étape de stockage peut en outre consister à stocker les informations de navigation d'un utilisateur dans au moins un équipement informatique, chaque équipement hébergeant un ensemble de bases de données formant moyens de stockage, le choix d'un équipement étant réalisé en fonction de la valeur d'un troisième caractère donné de l'identifiant de l'utilisateur ;
- le choix de l'équipement peut être réalisé en fonction d'un caractère de l'identifiant tel que la répartition des utilisateurs est homogène sur l'ensemble des valeurs que peut prendre ce caractère ;
- les informations de navigation de l'utilisateur peuvent être stockées dans une table de données d'une base de données hébergée par d'un équipement, le choix desdits équipement, base et table étant réalisé en fonction des trois premiers caractères de l'identifiant, ledit identifiant comportant douze caractères selon un système de numération en base 64.
Selon un second aspect, l'invention propose un système de stockage d'informations de navigation d'un ensemble d'utilisateurs d'un réseau de communication sur un ensemble de sites d'intérêt accessibles par le réseau, ledit système comportant des moyens de stockage reliés au réseau pour stocker les informations de navigation transmises, par chaque site de l'ensemble de sites d'intérêt, lorsqu'un utilisateur se connecte audit site, lesdites informations de navigation comprenant un identifiant unique de l'utilisateur constitué d'une pluralité de caractères, enregistré dans un cookie installé sur le poste de navigation de l'utilisateur, le système étant caractérisé en ce que lesdits moyens de stockage sont constituées d'un ensemble de bases de données distinctes les unes des autres, le choix d'une base de données pour le stockage des informations de navigation relatives à un utilisateur étant réalisé en fonction de la valeur d'un caractère donné de l'identifiant dudit utilisateur.
D'autres caractéristiques, buts et avantages de l'invention ressortiront encore de la description qui suit d'un mode de réalisation possible de l'invention, cette description étant purement illustrative et non limitative et devant être lue en regard de la figure unique annexée. Cette figure 1 est un schéma représentatif d'un système de stockage d'informations de navigation conforme à un mode de réalisation possible de l'invention. Sur la figure, un système de détermination de profil 400 est relié à un réseau de communication 200 (tel qu'Internet) auquel est connecté un ensemble 300 de serveurs Web d'intérêt 301 , 302, 303.
Chaque serveur Web héberge un site ou un contenu numérique mis à la disposition des utilisateurs 500 du réseau 200 (les internautes) par un fournisseur de services.
Le système 400 d'élaboration de profil comprend des moyens de stockage 100, 110 connectés au réseau 200, et adaptés pour recenser des informations relatives à la navigation des internautes 500 sur les sites hébergés par les serveurs Web 301 , 302, 303. Comme cela a été mentionné précédemment, ces informations de navigation sont transmises lors d'une requête de profil émise par un serveur Web d'intérêt 301 à destination du système de profiling lors de la visite d'un internaute sur le site.
Ces informations de navigation comprennent typiquement l'identifiant de l'internaute, l'identifiant du site, la date, l'heure et la langue du navigateur, la partie du site effectivement visitée. L'identifiant de l'internaute est généralement un identifiant unique enregistré dans un cookie (ou témoin de connexion) installé sur le poste de navigation de l'internaute.
Ce cookie est par exemple installé sur le poste de navigation de l'internaute (un identifiant unique étant alors attribué à l'internaute) lors de la première visite de celui-ci sur l'un des sites d'intérêt.
L'identifiant unique associé à un internaute est constitué d'une pluralité de caractères. Chaque caractère pouvant prendre un certain nombre de valeurs différentes, et cela en fonction de la base du système de numération retenu.
Selon un mode de réalisation de l'invention, l'identifiant comporte douze caractères, par exemple selon un système de numération en base 64. Chaque caractère peut ainsi prendre 64 valeurs différentes.
Selon un mode de réalisation préféré de l'invention, les informations de navigation sont réparties dans un ensemble, formant les moyens de stockage 100, de bases de données 101-103 distinctes les unes des autres, chaque base de données 101-103 stockant les informations de navigation relatives aux utilisateurs disposant d'un identifiant présentant, parmi la pluralité de caractères, un caractère donné identique ou un caractère donné prenant une valeur parmi un ensemble de valeurs.
En d'autres termes, ne sont stockées dans une même base de données
Bk que les informations de navigation relatives aux internautes dont le i-ème caractère (i.e ledit caractère donné) de l'identifiant a la même valeur Ck ou dont le i-ème caractère a une valeur parmi un ensemble {C}k de valeurs. De manière préférentielle, ce caractère donné est un caractère tel que la répartition des internautes est homogène (par exemple du fait d'un tirage aléatoire) sur l'ensemble des valeurs que peut prendre ce caractère. La probabilité que ce caractère donné de l'identifiant d'un internaute présente une valeur particulière est ainsi la même quelque soit ladite valeur particulière. On exploite avantageusement à cet effet la manière dont l'identifiant attribué à un internaute est élaboré. Dans le cadre d'un identifiant comportant douze caractères, on peut effectivement élaborer une répartition homogène des utilisateurs sur certains caractères, par exemple sur le premier et le deuxième caractères.
Les autres caractères de l'identifiant contiennent comme il est de coutume des éléments nécessaires à assurer, de préférence à eux seuls, l'unicité de l'identifiant. Il s'agit par exemple de la date et de l'heure en secondes, de l'adresse IP du serveur établissant l'identifiant, le PID (selon l'expression anglo-saxonne Process Identification Number pour numéro d'identification du processus) du processus établissant l'identifiant, un nombre incrémentiel, etc.
Dans le cas de figure d'une répartition homogène, et considérant un système de numération en base N, les internautes sont ainsi répartis, en fonction de la valeur prise par ledit caractère donné de leur identifiant, en N groupes de taille identique. On stocke ainsi les informations de navigation de manière homogène, et particulièrement simple, dans N bases de données distinctes.
Selon un mode de réalisation avantageux de l'invention, chacune des bases de données 101-103 ; 111-113 est constituée d'un ensemble de tables de données distinctes les unes des autres.
Les informations de navigation sont alors réparties de telle manière que chaque table de données stocke les informations de navigation relatives aux utilisateurs disposant d'un identifiant présentant, parmi la pluralité de caractères, un second caractère donné identique ou un second caractère donné ayant une valeur parmi un ensemble de valeurs.
En d'autres termes, ne sont stockées dans une même table de données
Tp, appartenant à une base de données Bk, que les informations de navigation relatives aux internautes dont le i-ème caractère (i.e le premier caractère donné) de l'identifiant a la même valeur Ck (ou tout du moins prend une valeur parmi un ensemble de valeurs {C}k) et dont le j-ème caractère (i.e le second caractère donné) a la même valeur Cp (ou tout du moins prend une valeur parmi un ensemble de valeurs {C}p).
De manière préférentielle, ce second caractère donné est ici aussi un caractère tel que la répartition des internautes est homogène (par exemple du fait d'un tirage obligatoire) sur l'ensemble des valeurs que peut prendre ce caractère. Dans un tel cas de figure, et considérant un système de numération en base N, les internautes sont ainsi répartis, en fonction de la valeur prise par lesdits premier et second caractères donnés de leur identifiant, en N*N groupes de taille identique. On stocke ainsi les informations de navigation de manière homogène, et particulièrement simple, dans N*N tables de données distinctes.
Comme cela a été mentionné précédemment, dans le cas d'un identifiant comportant douze caractères, on a une répartition homogène des utilisateurs sur le premier et le deuxième caractères de l'identifiant. Selon un mode de réalisation possible de l'invention, lesdits premier et second caractères donnés (associés respectivement à la répartition en bases et à la répartition en tables de données) sont respectivement le premier et le deuxième caractères de l'identifiant.
Selon un mode de réalisation alternatif de l'invention, le système de stockage comporte une pluralité de moyens de stockage 100, 110 du type présenté précédemment.
A cet effet, les bases de données sont hébergées par plusieurs équipements informatiques distincts, chaque équipement informatique comportant des moyens adaptés pour héberger un ensemble formant moyens de stockage au sens de la présente invention.
En d'autres termes chaque équipement héberge un ensemble de bases de données distinctes les unes des autres, chaque base de données stockant les informations de navigation relatives aux utilisateurs disposant d'un identifiant présentant, parmi la pluralité de caractères, un caractère donné identique (ou un caractère donné prenant une valeur parmi un ensemble de valeurs). En référence à la figure 1 , un équipement informatique 500 héberge les moyens de stockage 100 constitués par les bases de données 101-103, tandis qu'un équipement 510 héberge les moyens de stockage 110 constitués par les bases de données 111-113. Dans un tel cas de figure, les informations de navigation sont alors réparties de telle manière que chaque équipement stocke les informations de navigation relatives aux utilisateurs disposant d'un identifiant présentant, parmi la pluralité de caractères, un troisième caractère donné identique (ou encore un troisième caractère donné ayant une valeur parmi un ensemble de valeurs).
Les internautes sont ensuite repartis dans les bases de données en fonction dudit premier caractère donné de leur identifiant (par exemple le deuxième caractère de l'identifiant), ainsi que le cas échéant dans les tables de données constituant une base de données en fonction dudit second caractère donné de leur identifiant (par exemple le troisième caractère de l'identifiant).
Selon un mode de réalisation possible, ledit troisième caractère donné (pour une répartition entre équipements) est un caractère de l'identifiant, par exemple un caractère en en-tête dudit identifiant. Ainsi dans le cas mentionné ci-dessus d'un identifiant comportant douze caractères, un treizième caractère peut être ajouté en en-tête des douze autres pour permettre la répartition entre les différents équipements informatiques.
A titre d'exemple illustratif, les informations concernant l'internaute ayant l'identifiant SuNXXXXXXXXXX peuvent ainsi être stockées sur l'équipement S, dans la base u dans la table N.
Considérant un système de numération en base N, si on répartit les internautes sur différents dispositifs d'hébergement, on peut donc finalement les répartir jusqu'en N*N*N groupes.
En utilisant un seul équipement informatique, et dans le cadre d'un système de numération en base 64, les informations de navigation relatives aux internautes visitant l'un des sites d'intérêt sont ainsi réparties dans 64 bases de données distinctes, chacune de ces bases comportant 64 tables de données
Les informations de navigation sont dans ce cas de figure réparties dans 4096 tables de données distinctes, en fonction des valeurs prises par lesdits premier et second caractères donnés de l'identifiant de l'utilisateur.
Comme cela a déjà été mentionné précédemment, les informations de navigation disponibles pour un utilisateur donné sont par exemple destinées à être traitées par un système de profiling, afin de déterminer et mettre à jour, le profil dudit utilisateur. Le profil ainsi déterminé est stocké dans les moyens de stockage selon la répartition par utilisateur présentée ci-dessus.
L'architecture ici présentée des moyens de stockage par répartition des internautes dans des structures (équipements informatiques, bases, tables) de données distinctes est donc particulièrement intéressante. Elle permet notamment d'accéder rapidement aux informations de navigation et aux données de profil, de réaliser un traitement parallèle des différentes structures de données.
Bien entendu, l'invention n'est pas limitée aux modes de réalisation particuliers qui viennent d'être décrits, mais s'étend à toute variante conforme à son esprit. On comprendra notamment que l'emploi de l'invention n'est pas limité au cadre d'un procédé et système de profiling. L'invention trouve en effet application dès lors que des informations relatives à des utilisateurs d'un réseau de communication disposant d'un identifiant comportant une pluralité de caractères sont à stocker et traiter. En particulier, l'invention peut également être utilisée pour des systèmes comportant des serveurs de contenu publicitaire sur internet pour lesquels l'accès au profil et/ou à l'historique de l'internaute est très important. De même, la répartition des internautes proposée par l'invention permet de réaliser un échantillonnage très simple et efficace en vue de calcul prévisionnel ou de simulations. Par extension, l'invention trouve également application dans tout système devant traiter des données d'un très grand nombre d'objets identifiables, indépendamment les uns des autres. La répartition des informations de navigation réalisée par l'invention permet en outre de récupérer très rapidement une information sur un objet identifié parmi un très grand nombre d'objets, et cela sans qu'il ne soit nécessaire d'effectuer une requête, nécessairement longue, dans une « mega-base » de données.

Claims

REVENDICATIONS
1. Procédé de stockage d'informations de navigation d'un ensemble d'utilisateurs (500) d'un réseau de communication (200) sur un ensemble de sites d'intérêt (301-303) accessibles par le réseau, dans des moyens de stockage (100) reliés au réseau, comprenant l'étape consistant, pour chaque site de l'ensemble de sites d'intérêt, à transmettre aux moyens de stockage (100 ; 110) les informations de navigation d'un utilisateur se connectant audit site, lesdites informations de navigation comprenant un identifiant unique de l'utilisateur constitué d'une pluralité de caractères, enregistré dans un cookie installé sur le poste de navigation de l'utilisateur, le procédé étant caractérisé en ce qu'il comporte l'étape consistant à stocker les informations de navigation dudit utilisateur dans une base de données d'un ensemble, formant lesdits moyens de stockage, de bases de données (101-103 ; 11 1-1 13) distinctes les unes des autres, le choix de la base de données étant réalisé en fonction de la valeur d'un caractère donné de l'identifiant dudit utilisateur.
2. Procédé selon la revendication précédente, caractérisé en ce le choix de la base de données est réalisé en fonction d'un caractère donné de l'identifiant tel que la répartition des utilisateurs est homogène sur l'ensemble des valeurs que peut prendre ce caractère.
3. Procédé selon l'une des revendications précédentes, caractérisé en ce que l'étape de stockage consiste en outre, pour chaque base de données, à stocker les informations de navigation dudit utilisateur dans une table de données d'un ensemble, formant ladite base de données, de tables de données distinctes les unes des autres, le choix de la table de données étant réalisé en fonction de la valeur d'un second caractère donné de l'identifiant dudit utilisateur.
4. Procédé selon la revendication précédente, caractérisé en ce le choix de la table de données est réalisé en fonction d'un second caractère donné de l'identifiant tel que la répartition des utilisateurs est homogène sur l'ensemble des valeurs que peut prendre ce caractère.
5. Procédé selon l'une des revendications précédentes, caractérisé en ce que l'étape de stockage consiste en outre à stocker les informations de navigation d'un utilisateur dans au moins un équipement informatique (500, 510), chaque équipement hébergeant un ensemble de bases de données formant moyens (100, 1 10) de stockage, le choix d'un équipement étant réalisé en fonction de la valeur d'un troisième caractère donné de l'identifiant de l'utilisateur.
6. Procédé selon la revendication précédente, caractérisé en ce le choix de l'équipement est réalisé en fonction d'un caractère de l'identifiant tel que la répartition des utilisateurs est homogène sur l'ensemble des valeurs que peut prendre ce caractère.
7. Procédé selon la revendication précédente, caractérisé en ce que les informations de navigation de l'utilisateur sont stockées dans une table de données d'une base de données hébergée par un équipement, le choix desdits équipement, base et table étant réalisé en fonction des trois premiers caractères de l'identifiant, ledit identifiant comportant douze caractères selon un système de numération en base 64.
8. Système de stockage d'informations de navigation d'un ensemble d'utilisateurs (500) d'un réseau de communication (200) sur un ensemble de sites d'intérêt (301-303) accessibles par le réseau, ledit système comportant des moyens de stockage (100 ; 1 10) reliés au réseau pour stocker les informations de navigation transmises, par chaque site de l'ensemble de sites d'intérêt, lorsqu'un utilisateur se connecte audit site, lesdites informations de navigation comprenant un identifiant unique de l'utilisateur constitué d'une pluralité de caractères, enregistré dans un cookie installé sur le poste de navigation de l'utilisateur, le système étant caractérisé en ce que lesdits moyens de stockage
(100 ; 110) sont constituées d'un ensemble de bases de données (101- 103 ; 111-113) distinctes les unes des autres, le choix d'une base de données pour le stockage des informations de navigation relatives à un utilisateur étant réalisé en fonction de la valeur d'un caractère donné de l'identifiant dudit utilisateur.
9. Système selon la revendication précédente, caractérisé en ce que chacune des bases de données est constituée d'un ensemble de tables de données, le choix d'une table de données pour le stockage des informations de navigation relatives à un utilisateur étant réalisé en fonction de la valeur d'un second caractère donné de l'identifiant dudit utilisateur.
10. Système selon l'une des deux revendications précédentes, comporte au moins un équipement informatique (500, 510) hébergeant un ensemble de bases de données formant moyens (100, 110) de stockage, le choix d'un équipement étant réalisé en fonction de la valeur d'un troisième caractère donné de l'identifiant de l'utilisateur.
PCT/EP2005/054712 2004-09-20 2005-09-20 Procede et systeme exploitant le codage de cookie pour repartir des informations relatives a des internautes WO2006032671A1 (fr)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP05784556A EP1807778A1 (fr) 2004-09-20 2005-09-20 Procede et systeme exploitant le codage de cookie pour repartir des informations relatives a des internautes
US11/663,291 US20080177762A1 (en) 2004-09-20 2005-09-20 Method and System Using a Cookie Code For Distributing Infomation Related to Internet Users

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0409916 2004-09-20
FR0409916A FR2875616B1 (fr) 2004-09-20 2004-09-20 Procede et systeme exploitant le codage de cookie pour repartir des informations relatives a des internautes

Publications (1)

Publication Number Publication Date
WO2006032671A1 true WO2006032671A1 (fr) 2006-03-30

Family

ID=34950350

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2005/054712 WO2006032671A1 (fr) 2004-09-20 2005-09-20 Procede et systeme exploitant le codage de cookie pour repartir des informations relatives a des internautes

Country Status (4)

Country Link
US (1) US20080177762A1 (fr)
EP (1) EP1807778A1 (fr)
FR (1) FR2875616B1 (fr)
WO (1) WO2006032671A1 (fr)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5423037A (en) * 1992-03-17 1995-06-06 Teleserve Transaction Technology As Continuously available database server having multiple groups of nodes, each group maintaining a database copy with fragments stored on multiple nodes
FR2829258A1 (fr) * 2001-09-03 2003-03-07 Profile For You Ltd Procede et systeme de surveillance et d'analyse de la frequentation d'une ou plusieurs plateformes de mise a disposition d'informations
EP1341089A2 (fr) * 2002-02-27 2003-09-03 Netiq Corporation Echantillonage en ligne de trafic web

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3729730A (en) * 1971-04-14 1973-04-24 Cogar Corp Display system
US4769772A (en) * 1985-02-28 1988-09-06 Honeywell Bull, Inc. Automated query optimization method using both global and parallel local optimizations for materialization access planning for distributed databases
AU6494701A (en) * 2000-05-24 2001-12-03 Match Craft Inc Online media exchange
US20060069616A1 (en) * 2004-09-30 2006-03-30 David Bau Determining advertisements using user behavior information such as past navigation information
US7624176B2 (en) * 2004-10-14 2009-11-24 International Business Machines Corporation Method and system for programmatically generating synthetic transactions to monitor performance and availability of a web application
US7457835B2 (en) * 2005-03-08 2008-11-25 Cisco Technology, Inc. Movement of data in a distributed database system to a storage location closest to a center of activity for the data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5423037A (en) * 1992-03-17 1995-06-06 Teleserve Transaction Technology As Continuously available database server having multiple groups of nodes, each group maintaining a database copy with fragments stored on multiple nodes
FR2829258A1 (fr) * 2001-09-03 2003-03-07 Profile For You Ltd Procede et systeme de surveillance et d'analyse de la frequentation d'une ou plusieurs plateformes de mise a disposition d'informations
EP1341089A2 (fr) * 2002-02-27 2003-09-03 Netiq Corporation Echantillonage en ligne de trafic web

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HAIWEI YE ET AL: "Towards database scalability through efficient data distribution in e-commerce environments", ELECTRONIC COMMERCE, 2002. PROCEEDINGS. THIRD INTERNATIONAL SYMPOSIUM ON 18-19 OCT. 2002, PISCATAWAY, NJ, USA,IEEE, 18 October 2002 (2002-10-18), pages 87 - 95, XP010624481, ISBN: 0-7695-1861-3 *
OZSU M T ET AL: "DISTRIBUTED AND PARALLEL DATABASE SYSTEMS", ACM COMPUTING SURVEYS, NEW YORK, NY, US, vol. 28, no. 1, March 1996 (1996-03-01), pages 125 - 128, XP001130978, ISSN: 0360-0300 *

Also Published As

Publication number Publication date
FR2875616B1 (fr) 2012-11-30
FR2875616A1 (fr) 2006-03-24
US20080177762A1 (en) 2008-07-24
EP1807778A1 (fr) 2007-07-18

Similar Documents

Publication Publication Date Title
WO2006111452A1 (fr) Procédé d'optimisation de la gestion d'un cache de serveur pouvant être consulté par des terminaux clients de caractéristiques différentes
WO2006016055A2 (fr) Procede et serveur de referencement de diffusion poste a poste de fichiers demandes par telechargement a ce serveur
FR2979509A1 (fr) Procede et serveur pour le suivi des utilisateurs au cours de leur navigation dans un reseau de communication
FR2908212A1 (fr) Applications pour le profilage d'utilisateurs de services de telecommunications
WO2006035164A1 (fr) Systeme et procede interactif intelligent de gestion d'information
EP1927074A2 (fr) Procédé d'accès à des informations relatives à au moins un utilisateur permettant d'entrer en contact avec lui ultérieurement
WO2023079229A1 (fr) Systeme de suivi d´interactions sur une page internet
WO2006032671A1 (fr) Procede et systeme exploitant le codage de cookie pour repartir des informations relatives a des internautes
EP2880557B1 (fr) Procédé de traitement de données de connexion d'une plateforme d'un site internet
EP1073245A2 (fr) Procédé et dispositif pour évaluer les consultations de sites web
FR2960371A1 (fr) Procede et dispositif d'analyse de donnees interceptees sur un reseau ip pour la surveillance de l'activite des utilisateurs d'un site web
WO2016207542A1 (fr) Machine de vote electronique et infrastructure comportant une telle machine
EP2880558B1 (fr) Procédé de traitement de données pour analyse situationnelle
EP3205067A1 (fr) Procédé de diffusion de contenus en streaming dans un réseau pair à pair
FR3030820A1 (fr) Procede pour l'acces a un contenu numerique dans un reseau de communication, au moyen d'un equipement terminal connecte audit reseau de communication
Rochat Proxys Internet avancés
FR3118557A1 (fr) Contrôle de la transmission d’au moins un contenu depuis un équipement fournisseur vers un nœud d’ingestion.
WO2009013440A1 (fr) Procede d'echange de messages entre serveur de donnees de session et des services clients
Ibern Canadell et al. Facebook traffic data and cacheability
EP2191646A1 (fr) Procede de reduction de charge de serveurs, terminal, dispositif, et produit programme d'ordinateur correspondants
EP1492029A1 (fr) Procédé et dispositif de traitement d'informations ayant fait l'objet d'une réception antérieure dans un réseau de télécommunication tel que le réseau Internet
EP1622339A1 (fr) Procédé et dispositif de distinction de requêtes HTTP utilisateur
Boutet Antoine Boutet, Anne-Marie Kermarrec, Erwan Le Merrer, Alexandre Van Kempen
FR2919141A1 (fr) Procede d'obtention de donnees applicatives
FR3007550A1 (fr) Procede d evaluation d un objet tel que notamment un lieu ou un evenement par un utilisateur lie a un reseau social a partir d un terminal mobile sur une base de donnees en ligne - dispositif d evaluation associe

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KM KP KR KZ LC LK LR LS LT LU LV LY MA MD MG MK MN MW MX MZ NA NG NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU LV MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2005784556

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 2005784556

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 11663291

Country of ref document: US