EP1807778A1 - Procede et systeme exploitant le codage de cookie pour repartir des informations relatives a des internautes - Google Patents
Procede et systeme exploitant le codage de cookie pour repartir des informations relatives a des internautesInfo
- Publication number
- EP1807778A1 EP1807778A1 EP05784556A EP05784556A EP1807778A1 EP 1807778 A1 EP1807778 A1 EP 1807778A1 EP 05784556 A EP05784556 A EP 05784556A EP 05784556 A EP05784556 A EP 05784556A EP 1807778 A1 EP1807778 A1 EP 1807778A1
- Authority
- EP
- European Patent Office
- Prior art keywords
- user
- identifier
- character
- navigation information
- given
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
Definitions
- the invention relates to a method and a system for efficiently storing, particularly with a view to subsequent access or processing, information relating to the navigation of a large number of users of a communication network.
- the invention is of particular interest for the development of behavioral profiles of Internet users or any other communication network, as well as for the display of digital advertising messages based in particular on the history of messages already viewed.
- the Internet is an open network on which a large number of users circulate. In order to display the right message to the right person at a given time, it is very important to be able to access in a very short time information about this user.
- This information can be a pre-calculated profile, a complete browsing history on a set of sites of interest or a list of advertising messages already viewed by the user.
- the present invention provides a solution for simply managing a very large number of users (several billion for example).
- Web of interest or when it is exposed to an advertising message, it triggers the successive sending of requests to a system such as for example a behavioral profiling system, a system of audience measurement, or a system of advertising broadcast.
- a system such as for example a behavioral profiling system, a system of audience measurement, or a system of advertising broadcast.
- This browsing information typically includes the user's identifier, the site identifier or the advertising message, the date, the time and the browser language, the part of the site actually visited.
- the identifier of the user is usually a unique identifier stored in a cookie (or cookie) installed on the browser of the user.
- This cookie is for example installed on the navigation station of the user (a unique identifier is then assigned to the user) during the first visit of it on one of the sites of interest.
- the navigation information is typically recorded by the profiling system in storage means and constitute the browsing history of the user to be identified.
- the profiling system can determine a statistical profile of the user.
- the flow of data collected by the profiling or advertising distribution system i.e. browsing information of Internet users
- the flow of data collected by the profiling or advertising distribution system is particularly important. For example, when approximately 20,000 French sites of interest are audited, over 10 Giga Bytes of navigation information are collected each day.
- the mass of information is constantly increasing.
- a profiling or dissemination system of the type presented above must be able to respond to a certain number of constraints. In particular, it must be able to cover a large audience of Internet users, to be able to react in real time to send a user's profile to an applicant's site and to be very stable.
- the computer means used including storage means and browsing information processing servers
- the computer means used are able to access the stored information, process it and send it back in a minimum of time, and this while ensuring the continuity of service provided by the profiling or dissemination system. It is conceivable that such a system is inoperative if the profile of a user is returned to a web server in too much time.
- the invention proposes, according to a first aspect, a method for storing navigation information of a set of users of a communication network on a set of sites of interest accessible by the network, in storage means connected to the network, comprising the step of, for each site of the set of sites of interest, to transmit to the storage means the navigation information of a user connecting to said site, said navigation information comprising a unique identifier of the user consisting of a plurality of characters, stored in a cookie installed on the user's navigation station, the method being characterized in that it comprises the step of storing the information of navigation of said user in a database of a set, forming said storage means, databases separate from each other, the choice of the database being r Alisé depending on the value of a given character of the identifier of said user.
- Preferred but not limiting aspects of the method according to the first aspect of the invention are the following: the choice of the database can be made according to a given character of the identifier such that the distribution of the users is homogeneous over all the values that this character can take;
- the storage step may furthermore comprise, for each database, storing the navigation information of said user in a data table of a set, forming said database, of data tables distinct from one another the choice of the data table being made according to the value of a given second character of the identifier of said user; the choice of the data table can be made according to a given second character of the identifier such that the distribution of the users is homogeneous over all the values that this character can take;
- the storage step can further consist in storing the navigation information of a user in at least one computer equipment, each equipment hosting a set of databases forming storage means, the choice of a device being made in depending on the value of a given third character of the user's identifier;
- the choice of the equipment can be made according to a character of the identifier such that the distribution of the users is homogeneous over all the values that this character can take;
- the navigation information of the user can be stored in a data table of a database hosted by a device, the choice of said equipment, base and table being made according to the first three characters of the identifier said identifier having twelve characters according to a base number system 64.
- the invention proposes a navigation information storage system of a set of users of a communication network on a set of sites of interest accessible by the network, said system comprising means for storage connected to the network for storing the navigation information transmitted by each site of the set of sites of interest, when a user connects to said site, said navigation information comprising a unique identifier of the user consisting of a plurality of characters, stored in a cookie installed on the navigation station of the user, the system being characterized in that said storage means consist of a set of databases distinct from each other, the selection of a database for storing the navigation information relating to a user being made according to the value of a given character of the identifier of said user.
- FIG. 1 is a representative diagram of a navigation information storage system according to a possible embodiment of the invention.
- a profile determination system 400 is connected to a communication network 200 (such as the Internet) to which is connected a set 300 of web servers of interest 301, 302, 303.
- Each web server hosts a site or digital content made available to the users 500 of the network 200 (the net surfers) by a service provider.
- the profile generation system 400 comprises storage means 100, 110 connected to the network 200, and adapted to list information relating to the browsing of the Internet users 500 on the sites hosted by the web servers 301, 302, 303. As such previously mentioned, this navigation information is transmitted during a profile request sent by a Web server of interest 301 to the profiling system when a user visits the site.
- This navigation information typically includes the user's identifier, the site identifier, the date, the time and the language of the browser, the part of the site actually visited.
- the identifier of the user is usually a unique identifier stored in a cookie (or cookie) installed on the browser of the user.
- This cookie is for example installed on the navigation station of the user (a unique identifier is then assigned to the user) during the first visit of it on one of the sites of interest.
- the unique identifier associated with a user consists of a plurality of characters. Each character can take a number of different values, and this depending on the base of the selected numeral system.
- the identifier comprises twelve characters, for example according to a base number system 64. Each character can thus take 64 different values.
- the navigation information is distributed in a set, forming the storage means 100, 101-103 databases separate from each other, each database 101-103 storing the data.
- this character is a character such that the distribution of Internet users is homogeneous (for example due to a random draw) on all the values that can take this character.
- the probability that this given character of the identifier of a user has a particular value is thus the same whatever the value.
- the manner in which the identifier assigned to a user is developed is advantageously exploited. In the context of an identifier comprising twelve characters, it is possible to develop a homogeneous distribution of users on certain characters, for example on the first and second characters.
- the other characters of the identifier contain, as is customary, the elements necessary to ensure, preferably on their own, the uniqueness of the identifier. This is for example the date and time in seconds, the IP address of the server establishing the identifier, the PID (the English expression Process Identification Number for process identification number) of the process establishing the identifier, an incremental number, etc.
- the netizens are thus distributed, according to the value taken by said given character of their identifier, in N groups of identical size.
- the navigation information is thus stored in a homogeneous and particularly simple manner in N separate databases.
- each of the databases 101-103; 111-113 consists of a set of data tables that are distinct from one another.
- each data table stores the navigation information relating to the users having an identifier having, among the plurality of characters, a second identical given character or a second given character having a value among a set of values.
- this second given character is here also a character such that the distribution of Internet users is homogeneous (for example due to a compulsory draw) on all the values that can take this character.
- the Net surfers are thus distributed, according to the value taken by said first and second given characters of their identifier, in N * N groups of identical size.
- the navigation information is thus stored in a homogeneous and particularly simple manner in N * N separate data tables.
- said given first and second characters are respectively the first and the second characters of the identifier.
- the storage system comprises a plurality of storage means 100, 110 of the type presented above.
- the databases are hosted by a plurality of separate computer equipment, each computer equipment comprising means adapted to house a set of storage means in the sense of the present invention.
- each piece of equipment accommodates a set of databases that are distinct from one another, each database storing the navigation information relating to the users having an identifier having, among the plurality of characters, an identical given character ( or a given character taking a value from a set of values).
- a computer equipment 500 hosts the storage means 100 constituted by the 101-103 databases, while a device 510 hosts the storage means 110 constituted by the databases 111-113.
- the navigation information is then distributed in such a way that each equipment stores the navigation information relating to the users having an identifier having, among the plurality of characters, a third identical given character (or a third given character having one of a set of values).
- Internet users are then distributed in the databases according to said given first character of their identifier (for example the second character of the identifier), as well as, if applicable, in the data tables constituting a database according to said second identifier.
- given character of their identifier for example the third character of the identifier.
- said given third character (for a distribution between equipments) is a character of the identifier, for example a character in the header of said identifier.
- a thirteenth character can be added in the header of the other twelve to allow the distribution between the different computer equipment.
- the information concerning the user with the identifier SuNXXXXXXXXX can thus be stored on the equipment S, in the base u in the table N.
- the browsing information relating to the internet users visiting one of the sites of interest is thus divided into 64 separate databases, each of these databases containing 64 data tables
- the navigation information is distributed in 4096 different data tables, according to the values taken by said first and second given characters of the user's identifier.
- the navigation information available to a given user is for example intended to be processed by a profiling system, in order to determine and update the profile of said user.
- the profile thus determined is stored in the storage means according to the user distribution presented above.
- the architecture presented here means of distributing the distribution of Internet users in structures (computer equipment, bases, tables) of separate data is therefore particularly interesting. In particular, it makes it possible to quickly access navigation information and profile data, to perform a parallel processing of the different data structures.
- the invention is not limited to the particular embodiments which have just been described, but extends to any variant within its spirit. It will be understood in particular that the use of the invention is not limited to the framework of a method and profiling system.
- the invention finds effect when information relating to users of a communication network having an identifier comprising a plurality of characters are to be stored and processed.
- the invention can also be used for systems comprising Internet content content servers for which access to the profile and / or history of the user is very important.
- the distribution of Internet users proposed by the invention makes it possible to perform a very simple and effective sampling for the purposes of provisional calculation or simulations.
- the invention is also applicable in any system to process data of a very large number of identifiable objects, independently of each other.
- the distribution of navigation information made by the invention also makes it possible to recover very quickly information on an object identified among a very large number of objects, and this without the need to make a request, necessarily long , in a "mega-database" of data.
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Procédé de stockage d'informations de navigation d'un ensemble d'utilisateurs (500) d'un réseau de communication (200) sur un ensemble de sites d'intérêt (301-303) accessibles par le réseau, dans des moyens de stockage (100) reliés au réseau, comprenant l'étape consistant, pour chaque site de l'ensemble de sites d'intérêt, à transmettre aux moyens de stockage (100) les informations de navigation d'un utilisateur se connectant audit site, lesdites informations de navigation comprenant un identifiant unique de l'utilisateur constitué d'une pluralité de caractères, enregistré dans un cookie installé sur le poste de navigation de l'utilisateur, le procédé étant caractérisé en ce qu'il comporte l'étape consistant à stocker les informations de navigation dudit utilisateur dans une base de données d'un ensemble, formant lesdits moyensL' invention concer ne, selon un premier aspect, un procédé de stockage d'informations de navigation d'un ensemble d'utilisateurs (500) d'un réseau de communication (200) sur un ensemble de sites d'intérêt (301-303) accessibles par le réseau, dans des moyens de stockage (100) reliés au réseau, comprenant l'étape consistant, pour chaque site de l'ensemble de sites d'intérêt, à transmettre aux moyens de stockage (100) les informations de navigation d'un utilisateur se connectant audit site, lesdites informations de navigation comprenant un identifiant unique de l'utilis ateur constitué d'une pluralité de caractères, enregistré dans un cookie install é sur le poste de navigation de l'utilisateur, le procédé étant caractérisé en ce qu'il comporte l'étape consistant à stocker les informations de navigation dudit utilisateur dans une base de données d'un ensemble, formant lesdits moyens de stockage, de bases de données (101-103 ; 111-113) distinctes les unes des autres, le choix de la base de données étant réalisé en fonction de la valeur d'un caractère donné de l'identifiant dudit utilisateur.
Description
PROCEDE ET SYSTEME EXPLOITANT LE CODAGE DE COOKIE POUR REPARTIR DES INFORMATIONS RELATIVES A DES INTERNAUTES
L'invention concerne un procédé et un système permettant de stocker efficacement, notamment en vue d'un accès ou traitement subséquent, des informations relatives à la navigation d'un grand nombre d'utilisateurs d'un réseau de communication.
L'invention trouve tout particulièrement intérêt pour l'élaboration de profils comportementaux d'utilisateurs d'Internet ou de tout autre réseau de communication, ainsi que pour l'affichage de messages publicitaires numériques en fonction notamment de l'historique de messages déjà visualisés.
Le réseau Internet est un réseau ouvert sur lequel circule un très grand nombre d'utilisateurs. Afin d'afficher le bon message à la bonne personne à un moment donné, il est très important de pouvoir accéder en un temps très court à une information concernant cet utilisateur.
Cette information peut être un profil pre-calculé, un historique complet de navigation sur un ensemble de sites d'intérêts ou bien une liste de messages publicitaires déjà visualisés par l'internaute. La présente invention propose une solution permettant de gérer simplement un nombre très important d'utilisateurs (plusieurs milliards par exemple).
Lorsque l'internaute se connecte successivement à une série de sites
Web d'intérêt, ou lorsqu'il est exposé à un message publicitaire, il déclenche l'envoi successif de requêtes vers un système tel que par exemple un système de profiling comportemental, un système de mesure d'audience, ou encore un système de diffusion publicitaire.
Ces requêtes sont alors interprétées par le système comme une fourniture d'informations de navigation.
Ces informations de navigation comprennent typiquement l'identifiant de l'internaute, l'identifiant du site ou du message publicitaire, la date, l'heure et la langue du navigateur, la partie du site effectivement visitée.
L'identifiant de l'internaute est généralement un identifiant unique enregistré dans un cookie (ou témoin de connexion) installé sur le poste de navigation de l'internaute.
Ce cookie est par exemple installé sur le poste de navigation de l'internaute (un identifiant unique étant alors attribué à l'internaute) lors de la première visite de celui-ci sur l'un des sites d'intérêt. Les informations de navigation sont typiquement enregistrées par le système de profiling dans des moyens de stockage et constituent l'historique de navigation de l'internaute à identifier.
C'est notamment à partir de cet historique que le système de profiling peut déterminer un profil statistique de l'internaute. Le flux de données recueillies par le système de profiling ou de diffusion publicitaire (i.e. informations de navigation des internautes) est particulièrement important. A titre d'exemple, lorsque 20 000 sites francophones d'intérêt environ sont ainsi audités, plus de 10 Giga Octets d'informations de navigation sont recueillies chaque jour. Par ailleurs, la masse d'informations est en constante augmentation.
Un système de profiling ou de diffusion du type présenté ci-dessus doit pouvoir répondre à un certain nombre de contraintes. Il doit en particulier être capable de couvrir une large audience d'internautes, de pouvoir réagir en temps réel pour renvoyer le profil d'un internaute à un site le requérant et d'être d'une grande stabilité.
Cela implique que les moyens informatiques utilisés (notamment moyens de stockage et serveurs de traitement des informations de navigation) soient aptes à accéder à l'information stockée, à la traiter et à la renvoyer en un minimum de temps, et cela tout en assurant la continuité de service fourni par le système de profiling ou de diffusion.
On conçoit effectivement qu'un tel système est inopérant si le profil d'un internaute est renvoyé à un serveur Web dans un délai trop important.
On conçoit également que toute défaillance technique doit être évitée. L'interruption du service (c'est-à-dire lorsqu'un profil d'internaute n'est pas renvoyé à un serveur Web suite à une requête de celui-ci) fourni par le système de profiling est effectivement dommageable pour le fournisseur de service qui héberge le site Web. Ce dernier ne peut effectivement pas adapter dynamiquement le contenu numérique qu'il propose en fonction du profil de chaque internaute, et en optimiser ainsi l'efficacité. II existe donc un besoin pour une solution permettant de gérer les informations de navigation d'un nombre d'utilisateurs différents d'un réseau de communication particulièrement important, qui réponde aux contraintes mentionnées ci-dessus.
A cet effet, l'invention propose, selon un premier aspect, un procédé de stockage d'informations de navigation d'un ensemble d'utilisateurs d'un réseau de communication sur un ensemble de sites d'intérêt accessibles par le réseau, dans des moyens de stockage reliés au réseau, comprenant l'étape consistant, pour chaque site de l'ensemble de sites d'intérêt, à transmettre aux moyens de stockage les informations de navigation d'un utilisateur se connectant audit site, lesdites informations de navigation comprenant un identifiant unique de l'utilisateur constitué d'une pluralité de caractères, enregistré dans un cookie installé sur le poste de navigation de l'utilisateur, le procédé étant caractérisé en ce qu'il comporte l'étape consistant à stocker les informations de navigation dudit utilisateur dans une base de données d'un ensemble, formant lesdits moyens de stockage, de bases de données distinctes les unes des autres, le choix de la base de données étant réalisé en fonction de la valeur d'un caractère donné de l'identifiant dudit utilisateur.
Des aspects préférés, mais non limitatifs du procédé selon le premier aspect de l'invention sont les suivants :
- le choix de la base de données peut être réalisé en fonction d'un caractère donné de l'identifiant tel que la répartition des utilisateurs est homogène sur l'ensemble des valeurs que peut prendre ce caractère ;
- l'étape de stockage peut consister en outre, pour chaque base de données, à stocker les informations de navigation dudit utilisateur dans une table de données d'un ensemble, formant ladite base de données, de tables de données distinctes les unes des autres, le choix de la table de données étant réalisé en fonction de la valeur d'un second caractère donné de l'identifiant dudit utilisateur ; - le choix de la table de données peut être réalisé en fonction d'un second caractère donné de l'identifiant tel que la répartition des utilisateurs est homogène sur l'ensemble des valeurs que peut prendre ce caractère ;
- l'étape de stockage peut en outre consister à stocker les informations de navigation d'un utilisateur dans au moins un équipement informatique, chaque équipement hébergeant un ensemble de bases de données formant moyens de stockage, le choix d'un équipement étant réalisé en fonction de la valeur d'un troisième caractère donné de l'identifiant de l'utilisateur ;
- le choix de l'équipement peut être réalisé en fonction d'un caractère de l'identifiant tel que la répartition des utilisateurs est homogène sur l'ensemble des valeurs que peut prendre ce caractère ;
- les informations de navigation de l'utilisateur peuvent être stockées dans une table de données d'une base de données hébergée par d'un équipement, le choix desdits équipement, base et table étant réalisé en fonction des trois premiers caractères de l'identifiant, ledit identifiant comportant douze caractères selon un système de numération en base 64.
Selon un second aspect, l'invention propose un système de stockage d'informations de navigation d'un ensemble d'utilisateurs d'un réseau de communication sur un ensemble de sites d'intérêt accessibles par le réseau, ledit système comportant des moyens de stockage reliés au réseau pour stocker les informations de navigation transmises, par chaque site de l'ensemble de sites d'intérêt, lorsqu'un utilisateur se connecte audit site,
lesdites informations de navigation comprenant un identifiant unique de l'utilisateur constitué d'une pluralité de caractères, enregistré dans un cookie installé sur le poste de navigation de l'utilisateur, le système étant caractérisé en ce que lesdits moyens de stockage sont constituées d'un ensemble de bases de données distinctes les unes des autres, le choix d'une base de données pour le stockage des informations de navigation relatives à un utilisateur étant réalisé en fonction de la valeur d'un caractère donné de l'identifiant dudit utilisateur.
D'autres caractéristiques, buts et avantages de l'invention ressortiront encore de la description qui suit d'un mode de réalisation possible de l'invention, cette description étant purement illustrative et non limitative et devant être lue en regard de la figure unique annexée. Cette figure 1 est un schéma représentatif d'un système de stockage d'informations de navigation conforme à un mode de réalisation possible de l'invention. Sur la figure, un système de détermination de profil 400 est relié à un réseau de communication 200 (tel qu'Internet) auquel est connecté un ensemble 300 de serveurs Web d'intérêt 301 , 302, 303.
Chaque serveur Web héberge un site ou un contenu numérique mis à la disposition des utilisateurs 500 du réseau 200 (les internautes) par un fournisseur de services.
Le système 400 d'élaboration de profil comprend des moyens de stockage 100, 110 connectés au réseau 200, et adaptés pour recenser des informations relatives à la navigation des internautes 500 sur les sites hébergés par les serveurs Web 301 , 302, 303. Comme cela a été mentionné précédemment, ces informations de navigation sont transmises lors d'une requête de profil émise par un serveur Web d'intérêt 301 à destination du système de profiling lors de la visite d'un internaute sur le site.
Ces informations de navigation comprennent typiquement l'identifiant de l'internaute, l'identifiant du site, la date, l'heure et la langue du navigateur, la partie du site effectivement visitée.
L'identifiant de l'internaute est généralement un identifiant unique enregistré dans un cookie (ou témoin de connexion) installé sur le poste de navigation de l'internaute.
Ce cookie est par exemple installé sur le poste de navigation de l'internaute (un identifiant unique étant alors attribué à l'internaute) lors de la première visite de celui-ci sur l'un des sites d'intérêt.
L'identifiant unique associé à un internaute est constitué d'une pluralité de caractères. Chaque caractère pouvant prendre un certain nombre de valeurs différentes, et cela en fonction de la base du système de numération retenu.
Selon un mode de réalisation de l'invention, l'identifiant comporte douze caractères, par exemple selon un système de numération en base 64. Chaque caractère peut ainsi prendre 64 valeurs différentes.
Selon un mode de réalisation préféré de l'invention, les informations de navigation sont réparties dans un ensemble, formant les moyens de stockage 100, de bases de données 101-103 distinctes les unes des autres, chaque base de données 101-103 stockant les informations de navigation relatives aux utilisateurs disposant d'un identifiant présentant, parmi la pluralité de caractères, un caractère donné identique ou un caractère donné prenant une valeur parmi un ensemble de valeurs.
En d'autres termes, ne sont stockées dans une même base de données
Bk que les informations de navigation relatives aux internautes dont le i-ème caractère (i.e ledit caractère donné) de l'identifiant a la même valeur Ck ou dont le i-ème caractère a une valeur parmi un ensemble {C}k de valeurs. De manière préférentielle, ce caractère donné est un caractère tel que la répartition des internautes est homogène (par exemple du fait d'un tirage aléatoire) sur l'ensemble des valeurs que peut prendre ce caractère. La probabilité que ce caractère donné de l'identifiant d'un internaute présente une valeur particulière est ainsi la même quelque soit ladite valeur particulière.
On exploite avantageusement à cet effet la manière dont l'identifiant attribué à un internaute est élaboré. Dans le cadre d'un identifiant comportant douze caractères, on peut effectivement élaborer une répartition homogène des utilisateurs sur certains caractères, par exemple sur le premier et le deuxième caractères.
Les autres caractères de l'identifiant contiennent comme il est de coutume des éléments nécessaires à assurer, de préférence à eux seuls, l'unicité de l'identifiant. Il s'agit par exemple de la date et de l'heure en secondes, de l'adresse IP du serveur établissant l'identifiant, le PID (selon l'expression anglo-saxonne Process Identification Number pour numéro d'identification du processus) du processus établissant l'identifiant, un nombre incrémentiel, etc.
Dans le cas de figure d'une répartition homogène, et considérant un système de numération en base N, les internautes sont ainsi répartis, en fonction de la valeur prise par ledit caractère donné de leur identifiant, en N groupes de taille identique. On stocke ainsi les informations de navigation de manière homogène, et particulièrement simple, dans N bases de données distinctes.
Selon un mode de réalisation avantageux de l'invention, chacune des bases de données 101-103 ; 111-113 est constituée d'un ensemble de tables de données distinctes les unes des autres.
Les informations de navigation sont alors réparties de telle manière que chaque table de données stocke les informations de navigation relatives aux utilisateurs disposant d'un identifiant présentant, parmi la pluralité de caractères, un second caractère donné identique ou un second caractère donné ayant une valeur parmi un ensemble de valeurs.
En d'autres termes, ne sont stockées dans une même table de données
Tp, appartenant à une base de données Bk, que les informations de navigation relatives aux internautes dont le i-ème caractère (i.e le premier caractère donné) de l'identifiant a la même valeur Ck (ou tout du moins prend une valeur parmi un ensemble de valeurs {C}k) et dont le j-ème caractère (i.e
le second caractère donné) a la même valeur Cp (ou tout du moins prend une valeur parmi un ensemble de valeurs {C}p).
De manière préférentielle, ce second caractère donné est ici aussi un caractère tel que la répartition des internautes est homogène (par exemple du fait d'un tirage obligatoire) sur l'ensemble des valeurs que peut prendre ce caractère. Dans un tel cas de figure, et considérant un système de numération en base N, les internautes sont ainsi répartis, en fonction de la valeur prise par lesdits premier et second caractères donnés de leur identifiant, en N*N groupes de taille identique. On stocke ainsi les informations de navigation de manière homogène, et particulièrement simple, dans N*N tables de données distinctes.
Comme cela a été mentionné précédemment, dans le cas d'un identifiant comportant douze caractères, on a une répartition homogène des utilisateurs sur le premier et le deuxième caractères de l'identifiant. Selon un mode de réalisation possible de l'invention, lesdits premier et second caractères donnés (associés respectivement à la répartition en bases et à la répartition en tables de données) sont respectivement le premier et le deuxième caractères de l'identifiant.
Selon un mode de réalisation alternatif de l'invention, le système de stockage comporte une pluralité de moyens de stockage 100, 110 du type présenté précédemment.
A cet effet, les bases de données sont hébergées par plusieurs équipements informatiques distincts, chaque équipement informatique comportant des moyens adaptés pour héberger un ensemble formant moyens de stockage au sens de la présente invention.
En d'autres termes chaque équipement héberge un ensemble de bases de données distinctes les unes des autres, chaque base de données stockant les informations de navigation relatives aux utilisateurs disposant d'un identifiant présentant, parmi la pluralité de caractères, un caractère donné identique (ou un caractère donné prenant une valeur parmi un ensemble de valeurs).
En référence à la figure 1 , un équipement informatique 500 héberge les moyens de stockage 100 constitués par les bases de données 101-103, tandis qu'un équipement 510 héberge les moyens de stockage 110 constitués par les bases de données 111-113. Dans un tel cas de figure, les informations de navigation sont alors réparties de telle manière que chaque équipement stocke les informations de navigation relatives aux utilisateurs disposant d'un identifiant présentant, parmi la pluralité de caractères, un troisième caractère donné identique (ou encore un troisième caractère donné ayant une valeur parmi un ensemble de valeurs).
Les internautes sont ensuite repartis dans les bases de données en fonction dudit premier caractère donné de leur identifiant (par exemple le deuxième caractère de l'identifiant), ainsi que le cas échéant dans les tables de données constituant une base de données en fonction dudit second caractère donné de leur identifiant (par exemple le troisième caractère de l'identifiant).
Selon un mode de réalisation possible, ledit troisième caractère donné (pour une répartition entre équipements) est un caractère de l'identifiant, par exemple un caractère en en-tête dudit identifiant. Ainsi dans le cas mentionné ci-dessus d'un identifiant comportant douze caractères, un treizième caractère peut être ajouté en en-tête des douze autres pour permettre la répartition entre les différents équipements informatiques.
A titre d'exemple illustratif, les informations concernant l'internaute ayant l'identifiant SuNXXXXXXXXXX peuvent ainsi être stockées sur l'équipement S, dans la base u dans la table N.
Considérant un système de numération en base N, si on répartit les internautes sur différents dispositifs d'hébergement, on peut donc finalement les répartir jusqu'en N*N*N groupes.
En utilisant un seul équipement informatique, et dans le cadre d'un système de numération en base 64, les informations de navigation relatives aux internautes visitant l'un des sites d'intérêt sont ainsi réparties dans 64
bases de données distinctes, chacune de ces bases comportant 64 tables de données
Les informations de navigation sont dans ce cas de figure réparties dans 4096 tables de données distinctes, en fonction des valeurs prises par lesdits premier et second caractères donnés de l'identifiant de l'utilisateur.
Comme cela a déjà été mentionné précédemment, les informations de navigation disponibles pour un utilisateur donné sont par exemple destinées à être traitées par un système de profiling, afin de déterminer et mettre à jour, le profil dudit utilisateur. Le profil ainsi déterminé est stocké dans les moyens de stockage selon la répartition par utilisateur présentée ci-dessus.
L'architecture ici présentée des moyens de stockage par répartition des internautes dans des structures (équipements informatiques, bases, tables) de données distinctes est donc particulièrement intéressante. Elle permet notamment d'accéder rapidement aux informations de navigation et aux données de profil, de réaliser un traitement parallèle des différentes structures de données.
Bien entendu, l'invention n'est pas limitée aux modes de réalisation particuliers qui viennent d'être décrits, mais s'étend à toute variante conforme à son esprit. On comprendra notamment que l'emploi de l'invention n'est pas limité au cadre d'un procédé et système de profiling. L'invention trouve en effet application dès lors que des informations relatives à des utilisateurs d'un réseau de communication disposant d'un identifiant comportant une pluralité de caractères sont à stocker et traiter. En particulier, l'invention peut également être utilisée pour des systèmes comportant des serveurs de contenu publicitaire sur internet pour lesquels l'accès au profil et/ou à l'historique de l'internaute est très important. De même, la répartition des internautes proposée par l'invention permet de réaliser un échantillonnage très simple et efficace en vue de calcul prévisionnel ou de simulations.
Par extension, l'invention trouve également application dans tout système devant traiter des données d'un très grand nombre d'objets identifiables, indépendamment les uns des autres. La répartition des informations de navigation réalisée par l'invention permet en outre de récupérer très rapidement une information sur un objet identifié parmi un très grand nombre d'objets, et cela sans qu'il ne soit nécessaire d'effectuer une requête, nécessairement longue, dans une « mega-base » de données.
Claims
1. Procédé de stockage d'informations de navigation d'un ensemble d'utilisateurs (500) d'un réseau de communication (200) sur un ensemble de sites d'intérêt (301-303) accessibles par le réseau, dans des moyens de stockage (100) reliés au réseau, comprenant l'étape consistant, pour chaque site de l'ensemble de sites d'intérêt, à transmettre aux moyens de stockage (100 ; 110) les informations de navigation d'un utilisateur se connectant audit site, lesdites informations de navigation comprenant un identifiant unique de l'utilisateur constitué d'une pluralité de caractères, enregistré dans un cookie installé sur le poste de navigation de l'utilisateur, le procédé étant caractérisé en ce qu'il comporte l'étape consistant à stocker les informations de navigation dudit utilisateur dans une base de données d'un ensemble, formant lesdits moyens de stockage, de bases de données (101-103 ; 11 1-1 13) distinctes les unes des autres, le choix de la base de données étant réalisé en fonction de la valeur d'un caractère donné de l'identifiant dudit utilisateur.
2. Procédé selon la revendication précédente, caractérisé en ce le choix de la base de données est réalisé en fonction d'un caractère donné de l'identifiant tel que la répartition des utilisateurs est homogène sur l'ensemble des valeurs que peut prendre ce caractère.
3. Procédé selon l'une des revendications précédentes, caractérisé en ce que l'étape de stockage consiste en outre, pour chaque base de données, à stocker les informations de navigation dudit utilisateur dans une table de données d'un ensemble, formant ladite base de données, de tables de données distinctes les unes des autres, le choix de la table de données étant réalisé en fonction de la valeur d'un second caractère donné de l'identifiant dudit utilisateur.
4. Procédé selon la revendication précédente, caractérisé en ce le choix de la table de données est réalisé en fonction d'un second caractère donné de l'identifiant tel que la répartition des utilisateurs est homogène sur l'ensemble des valeurs que peut prendre ce caractère.
5. Procédé selon l'une des revendications précédentes, caractérisé en ce que l'étape de stockage consiste en outre à stocker les informations de navigation d'un utilisateur dans au moins un équipement informatique (500, 510), chaque équipement hébergeant un ensemble de bases de données formant moyens (100, 1 10) de stockage, le choix d'un équipement étant réalisé en fonction de la valeur d'un troisième caractère donné de l'identifiant de l'utilisateur.
6. Procédé selon la revendication précédente, caractérisé en ce le choix de l'équipement est réalisé en fonction d'un caractère de l'identifiant tel que la répartition des utilisateurs est homogène sur l'ensemble des valeurs que peut prendre ce caractère.
7. Procédé selon la revendication précédente, caractérisé en ce que les informations de navigation de l'utilisateur sont stockées dans une table de données d'une base de données hébergée par un équipement, le choix desdits équipement, base et table étant réalisé en fonction des trois premiers caractères de l'identifiant, ledit identifiant comportant douze caractères selon un système de numération en base 64.
8. Système de stockage d'informations de navigation d'un ensemble d'utilisateurs (500) d'un réseau de communication (200) sur un ensemble de sites d'intérêt (301-303) accessibles par le réseau, ledit système comportant des moyens de stockage (100 ; 1 10) reliés au réseau pour stocker les informations de navigation transmises, par chaque site de l'ensemble de sites d'intérêt, lorsqu'un utilisateur se connecte audit site, lesdites informations de navigation comprenant un identifiant unique de l'utilisateur constitué d'une pluralité de caractères, enregistré dans un cookie installé sur le poste de navigation de l'utilisateur, le système étant caractérisé en ce que lesdits moyens de stockage
(100 ; 110) sont constituées d'un ensemble de bases de données (101- 103 ; 111-113) distinctes les unes des autres, le choix d'une base de données pour le stockage des informations de navigation relatives à un utilisateur étant réalisé en fonction de la valeur d'un caractère donné de l'identifiant dudit utilisateur.
9. Système selon la revendication précédente, caractérisé en ce que chacune des bases de données est constituée d'un ensemble de tables de données, le choix d'une table de données pour le stockage des informations de navigation relatives à un utilisateur étant réalisé en fonction de la valeur d'un second caractère donné de l'identifiant dudit utilisateur.
10. Système selon l'une des deux revendications précédentes, comporte au moins un équipement informatique (500, 510) hébergeant un ensemble de bases de données formant moyens (100, 110) de stockage, le choix d'un équipement étant réalisé en fonction de la valeur d'un troisième caractère donné de l'identifiant de l'utilisateur.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0409916A FR2875616B1 (fr) | 2004-09-20 | 2004-09-20 | Procede et systeme exploitant le codage de cookie pour repartir des informations relatives a des internautes |
PCT/EP2005/054712 WO2006032671A1 (fr) | 2004-09-20 | 2005-09-20 | Procede et systeme exploitant le codage de cookie pour repartir des informations relatives a des internautes |
Publications (1)
Publication Number | Publication Date |
---|---|
EP1807778A1 true EP1807778A1 (fr) | 2007-07-18 |
Family
ID=34950350
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP05784556A Withdrawn EP1807778A1 (fr) | 2004-09-20 | 2005-09-20 | Procede et systeme exploitant le codage de cookie pour repartir des informations relatives a des internautes |
Country Status (4)
Country | Link |
---|---|
US (1) | US20080177762A1 (fr) |
EP (1) | EP1807778A1 (fr) |
FR (1) | FR2875616B1 (fr) |
WO (1) | WO2006032671A1 (fr) |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3729730A (en) * | 1971-04-14 | 1973-04-24 | Cogar Corp | Display system |
US4769772A (en) * | 1985-02-28 | 1988-09-06 | Honeywell Bull, Inc. | Automated query optimization method using both global and parallel local optimizations for materialization access planning for distributed databases |
US5423037A (en) * | 1992-03-17 | 1995-06-06 | Teleserve Transaction Technology As | Continuously available database server having multiple groups of nodes, each group maintaining a database copy with fragments stored on multiple nodes |
EP1305741A4 (fr) * | 2000-05-24 | 2005-04-27 | Overture Services Inc | Change de m dias en ligne |
FR2829258A1 (fr) * | 2001-09-03 | 2003-03-07 | Profile For You Ltd | Procede et systeme de surveillance et d'analyse de la frequentation d'une ou plusieurs plateformes de mise a disposition d'informations |
US7185085B2 (en) * | 2002-02-27 | 2007-02-27 | Webtrends, Inc. | On-line web traffic sampling |
US20060069616A1 (en) * | 2004-09-30 | 2006-03-30 | David Bau | Determining advertisements using user behavior information such as past navigation information |
US7624176B2 (en) * | 2004-10-14 | 2009-11-24 | International Business Machines Corporation | Method and system for programmatically generating synthetic transactions to monitor performance and availability of a web application |
US7457835B2 (en) * | 2005-03-08 | 2008-11-25 | Cisco Technology, Inc. | Movement of data in a distributed database system to a storage location closest to a center of activity for the data |
-
2004
- 2004-09-20 FR FR0409916A patent/FR2875616B1/fr not_active Expired - Lifetime
-
2005
- 2005-09-20 WO PCT/EP2005/054712 patent/WO2006032671A1/fr active Application Filing
- 2005-09-20 US US11/663,291 patent/US20080177762A1/en not_active Abandoned
- 2005-09-20 EP EP05784556A patent/EP1807778A1/fr not_active Withdrawn
Non-Patent Citations (1)
Title |
---|
See references of WO2006032671A1 * |
Also Published As
Publication number | Publication date |
---|---|
FR2875616A1 (fr) | 2006-03-24 |
WO2006032671A1 (fr) | 2006-03-30 |
US20080177762A1 (en) | 2008-07-24 |
FR2875616B1 (fr) | 2012-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1872277A1 (fr) | Procédé d'optimisation de la gestion d'un cache de serveur pouvant être consulté par des terminaux clients de caractéristiques différentes | |
WO2006016055A2 (fr) | Procede et serveur de referencement de diffusion poste a poste de fichiers demandes par telechargement a ce serveur | |
EP1805652A2 (fr) | Systeme et procede interactif intelligent de gestion d'information | |
FR2890822A1 (fr) | Dispositif et procede d'obtention automatisee d'informations relatives aux audiences de programmes transmis par un reseau de communication | |
WO2007033814A2 (fr) | Procédé d'accès à des informations relatives à au moins un utilisateur permettant d'entrer en contact avec lui ultérieurement | |
EP1807778A1 (fr) | Procede et systeme exploitant le codage de cookie pour repartir des informations relatives a des internautes | |
WO2016055645A1 (fr) | Procédé de diffusion de contenus en streaming dans un réseau pair à pair | |
FR2960371A1 (fr) | Procede et dispositif d'analyse de donnees interceptees sur un reseau ip pour la surveillance de l'activite des utilisateurs d'un site web | |
WO2016207542A1 (fr) | Machine de vote electronique et infrastructure comportant une telle machine | |
FR2778520A1 (fr) | Procede pour evaluer les consultations de sites accessibles par un reseau de telecommunications, et module utilisable dans la mise en oeuvre de ce procede | |
FR2831746A1 (fr) | Procede, systeme et commutateur pour associer un serveur auxiliaire d'un reseau d'acheminement de contenus a un equipement d'un reseau informatique | |
CA2880413A1 (fr) | Procede de traitement de donnees de connexion d'une plateforme d'un site internet | |
FR3030820A1 (fr) | Procede pour l'acces a un contenu numerique dans un reseau de communication, au moyen d'un equipement terminal connecte audit reseau de communication | |
WO2022144512A2 (fr) | Contrôle de la transmission d'au moins un contenu depuis un equipement fournisseur vers un noeud d'ingestion | |
Rochat | Proxys Internet avancés | |
WO2009013440A1 (fr) | Procede d'echange de messages entre serveur de donnees de session et des services clients | |
Ibern Canadell et al. | Facebook traffic data and cacheability | |
EP2191646A1 (fr) | Procede de reduction de charge de serveurs, terminal, dispositif, et produit programme d'ordinateur correspondants | |
EP1622339A1 (fr) | Procédé et dispositif de distinction de requêtes HTTP utilisateur | |
FR3083658A1 (fr) | Procede de partage de sequences video geolocalisees et reliees a des sites avec navigation par categorie | |
FR2919141A1 (fr) | Procede d'obtention de donnees applicatives | |
EP1342354A2 (fr) | Procede de mesure et d'analyse d'audience sur reseaux de communication | |
WO2001089214A1 (fr) | Methode de gestion de bases de donnees distribuees | |
FR3030802A1 (fr) | Systeme et procede informatises de gestion du stockage de donnees dans un environnement de stockage distribue en multi-nuage | |
EP2423811A1 (fr) | Procédé et dispositif de test non perturbatif de fonctionnement d'une application de fourniture d'informations accessibles à certaines dates |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
17P | Request for examination filed |
Effective date: 20070419 |
|
AK | Designated contracting states |
Kind code of ref document: A1 Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LI LT LU LV MC NL PL PT RO SE SI SK TR |
|
DAX | Request for extension of the european patent (deleted) | ||
17Q | First examination report despatched |
Effective date: 20130214 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN |
|
18D | Application deemed to be withdrawn |
Effective date: 20130827 |