WO2003001419A1 - Method and system for detecting an emergence of information phenomenon from sampled digital data - Google Patents

Method and system for detecting an emergence of information phenomenon from sampled digital data Download PDF

Info

Publication number
WO2003001419A1
WO2003001419A1 PCT/FR2002/002095 FR0202095W WO03001419A1 WO 2003001419 A1 WO2003001419 A1 WO 2003001419A1 FR 0202095 W FR0202095 W FR 0202095W WO 03001419 A1 WO03001419 A1 WO 03001419A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
variables
variable
analysis
weighting coefficient
Prior art date
Application number
PCT/FR2002/002095
Other languages
French (fr)
Inventor
Luigi Lancieri
Nicolas Durand
Original Assignee
France Telecom Societe Anonyme
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom Societe Anonyme filed Critical France Telecom Societe Anonyme
Publication of WO2003001419A1 publication Critical patent/WO2003001419A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Definitions

  • the present invention has for its object, a method and a system for detecting a phenomenon of emergence of information, from sampled digital data, capable of being implemented discreetly, per user, an implementation for a group of users, or even a population of users, which can simply be reduced to a multiplication of implementation of the method respectively of the system object of the present invention, in order to infer statistical results.
  • the specific methods of behavioral study of the users correspond to methods of preloading, or "pre-fetching" in Anglo-Saxon language, in which pre-load information that is likely to be used by users.
  • the aforementioned current preloading methods can be classified into two main types:
  • a first type consists in analyzing the HTML files consulted
  • - a second type consists of using statistical methods, as mentioned above.
  • Such a system implements a cache proxy analyzing the HTML files received by the user and makes a loading of the documents which are included, or whose address is included, that is to say stored, in the proxy.
  • the present invention relates to the implementation of a method and a system for detecting an emergence phenomenon information from sampled digital data, applicable without limitation to pre-loading or pre-fetching.
  • the method and the system which are the subject of the present invention are distinguished from the aforementioned methods and systems of the prior art due to the fact, on the one hand, that no preloading of the links of the HTML pages requested by the users and that, on the other hand, no statistical calculation on the successions of URLs accessed is performed.
  • An object of the present invention is, on the contrary, the implementation of a method and a system for detecting a phenomenon of emergence of information, from sampled digital data, by discrimination of data centers. user interest.
  • Another object of the present invention is the implementation of a method and a system for detecting a phenomenon of emergence of information allowing a semantically oriented preselection of portions of the WEB consistent with the interests of the users.
  • the method of detecting a phenomenon of emergence of information, from sampled digital data, medium of this information, object of the present invention, is remarkable in that it consists, for a plurality of variables medium of this information: to define a duration of analysis to highlight this phenomenon of emergence; calculating over this analysis duration, for each of the variables, a weighting coefficient as a function of this duration, one or more values of this weighting coefficient being associated with each variable considered; calculating over this analysis period the increase in the values of the weighting coefficient associated with each variable; to compare this increase with a determined threshold value, specific to each variable.
  • the phenomenon of information emergence is detected for any variable whose increase in the weighting coefficient values is greater than the specific determined threshold value.
  • the system for detecting a phenomenon of emergence of information from sampled digital data supporting this information, object of the invention is remarkable in that it comprises at least: a storage module, on at least a duration of analysis, digital data in the form of digital data blocks, constituting information units; - a database containing a plurality of reference variables, each variable being representative of an event capable of being highlighted in at least one information unit; - a detection module in a plurality of information units of the occurrence of at least one variable; a module for calculating, for each of these variables, a weighting coefficient as a function of this duration of analysis, this weighting coefficient being associated with this variable and stored in the database; a module for calculating, over this analysis period, the increase in the values of the weighting coefficient associated with each variable; a comparator module of this increase to a determined threshold value, specific to each variable.
  • the method and the system for detecting a phenomenon of emergence of information from sampled digital data, object of the present invention find application not only to the preloading process previously described in the description, during the access to HTML pages or WEB sites by users, but also when accessing video or audiovisual programs via television broadcasting networks. They will be better understood on reading the description and on observing the drawings below in which: the figure represents it, by way of illustration, a flow diagram of the essential steps allowing the implementation of the method for detecting a phenomenon emergence of information in accordance with the object of the present invention; FIG. 1b represents, by way of illustration, a diagram of the organization of the information support variables whose emergence must be demonstrated, by virtue of the implementation of the method which is the subject of the invention; FIGS.
  • le and ld represent, by way of illustration, a time diagram of the evolution of values of weighting coefficients assigned to a support variable of this information constituted by a first thematic variable "Auto", respectively by a second thematic variable “Vegetal”"; the figure represents it, by way of illustration, a time diagram explaining the method of calculating the specific threshold value associated with each information carrier variable;
  • FIG. 2a represents, by way of illustration, the general architecture of a system for detecting a phenomenon of information emergence, object of the invention, more particularly intended for use on the INTERNET network, each unit of information consisting of an HTML page acquired from a WEB site;
  • FIGS. 2b to 2e represent, by way of illustration, different examples of use of the system which is the subject of the invention, as illustrated in FIG. 2a.
  • the digital data sampled being a priori arbitrary and possibly consisting of digital data of text or, where appropriate, of images, "bitmap" image for example, it is indicated that the information carrier variables, the variables Vi, can be made up of character strings, logos, trademarks and finally by any computer object likely to be contained and recognized in the aforementioned sampled digital data.
  • the method which is the subject of the invention consists of a step A to define a duration of analysis to demonstrate the phenomenon of emergence.
  • the aforementioned step A can consist in introducing a duration of analysis ADj constituted either by a time range defined by two dates expressed for example in years, months and days, or, if necessary, in number of accesses to one or more WEB sites, for example, or even, where appropriate, in number of HTML pages acquired from one or more of the aforementioned WEB sites.
  • Step A is then followed by a step B consisting in calculating over the duration of analysis ADj and for each of the variables Vi, a weighting coefficient as a function of the duration of analysis ADj.
  • a weighting coefficient can take, on the analysis value ADj, several values denoted Pik of this coefficient, all of these values and the corresponding coefficient being then associated with each variable Vi considered.
  • step C test step consisting in comparing the above-mentioned increase with a determined threshold value, specific to each variable Vi.
  • the comparison operation is given by equation (3):
  • Si represents the determined threshold value specific to the variable Vi and [ ⁇ Pik] represents the set of values of increase in the weighting coefficient associated with the aforementioned variable Vi. It is thus understood, according to a non-limiting embodiment of the method which is the subject of the present invention, that the phenomenon of emergence of the information supported by the variable Vi is highlighted when at least one of the increase values ⁇ Pik over the analysis period ADj is greater than the threshold value Si previously mentioned.
  • the phenomenon of emergence of information is detected for any variable Vi including the increase in the values of the weighting coefficient and, at least, one of these values of increase is greater than the threshold value Si.
  • the variable Vi considered can then be classified and stored as belonging to a set of emerging variables, denoted Evi, for which the phenomenon of emergence has been highlighted.
  • the Evi set can be made up either of a list of emerging variables, or by a directory containing all the emerging variables.
  • a return by a step F can be expected, ie towards the starting step S , via a sub-step FI, or towards step A, 'via a sub-step F2.
  • the passage and the choice to the sub-step FI or F2 can be left to the choice of the user, by means of a choice command, noted T in FIG.
  • this duration of analysis ADj can advantageously be defined as a number, in this case a number of events generating the information sought, that is to say ie information for which the phenomenon of emergence must be highlighted. This number, in this case, can be reduced to a number of HTML pages for example when the method, object of the present invention, is implemented in the context of access to WEB sites on the INTERNET network.
  • the variables Vi can be chosen from different types of variables, noted Typ, these types of variables can be classified into thematic variables, behavioral variables and context variables or, where appropriate, of support as will be described below.
  • variables of the aforementioned types have been represented, which, by way of nonlimiting example, are designated by:
  • a set of variables is attached to a user. This user defines or receives this set of variables, as mentioned previously in the description, in step S.
  • Each character or word chain is assigned a weighting coefficient reflecting the level of consultation, that is to say the importance of this variable for the user considered.
  • weighting coefficient and, in particular, the values
  • Pik can correspond to a relative frequency value of the occurrence of the variable Vi considered over the analysis duration ADj.
  • weighting values are represented, in FIGS. Le and ld, for two thematic variables corresponding, for example, to the word “Auto” and to the word “Vegetal” or to a word having a direct relationship with the word
  • each thematic variable can in fact cover a set of thematic sub-variables of course belonging to the same theme, sub-variables such as: tree, flower, or other for the thematic variable "plant”.
  • the weighting coefficients and the Pik values of the latter are then calculated by iteration as the user accesses an item of information, such as an HTML page for example, an item which can be described by the variables. Vi corresponding.
  • the user watches an action film on automobiles.
  • the user consults a document on trees, and therefore plants.
  • the user views a document on automobiles.
  • the user views a program on motorsport.
  • the set of these weighting values represents a multidimensional algebraic space in which evolves the overall profile of the user. It is understood, in particular, that the values indicated in the aforementioned tables can correspond to values of real occurrence of the variables or types of corresponding variables. These values can correspond to absolute occurrence values or, where appropriate, to occurrence or relative frequency values reduced to the number of detected variables.
  • the different types of variables as well as the relationships between these types and these variables are stored in a database, so as to allow the reconstruction of the chronology of evolution of the weighting coefficient of each variable Vi.
  • the above figures show a time diagram of the values of the weighting coefficients corresponding to the above variables.
  • Figure le we can see most clearly that the "Auto” theme is dominant compared to the "Tree” theme due to the very significant increase in a Pik weighting value for the variable "Auto” on the analysis time ADj.
  • the process for detecting emergence phenomena is as follows: for a given time interval, that is to say for a given analysis time ADj, and for each of the variables Vi, the increase in the aforementioned weighting coefficient according to relation 2 previously given in the description.
  • this threshold value can be calculated, for each user, according to the habits of the latter.
  • an increase value is defined, which is the average of the weighting coefficient associated with the variable i considered. This average value being noted ⁇ Pij, as shown in Figure le.
  • the average values of the increases in the values of the weighting coefficients are denoted, consequently, ⁇ Pil to ⁇ Pi7.
  • the threshold value Si specific to each variable Vi is taken equal to the average of the increases in the values of weighting coefficients calculated for the durations of analysis prior and / or subsequent to a duration d current analysis for example.
  • the threshold value Si specific to each variable Vi can also be taken equal to the weighted average of the increases in the values of the weighting coefficients calculated for the durations of analyzes preceding and / or subsequent to a duration of current analysis. and thus verify the relation (5):
  • AD designates the total duration of the durations of elementary analyzes ADj taken into account.
  • the system, object of the present invention is implemented, by a provider of access to the WEB, from a workstation WS for example, which can include, in a conventional manner, a display screen DU, a central computing unit CPU, a working memory RAM and a mass memory denoted HDD as well as the conventional peripheral elements such as keyboard, mouse or others for example.
  • the WS workstation is interconnected to the INTERNET network by conventional circuits, such as a modem for example, not shown in the drawing.
  • the system which is the subject of the invention comprises at least one storage module over at least one analysis time AD, digital data in the form of digital data blocks constituting information units.
  • the storage module can be constituted by the mass memory unit HDD, which makes it possible, by means of the RAM memory, to store the digital data in the form of the aforementioned HTML pages.
  • the system which is the subject of the invention comprises a database, denoted DB, which can be installed on the aforementioned HDD mass memory, the database naturally containing the plurality of so-called reference variables, the variables Vi. Each variable is representative of an event whose emergence is likely to be highlighted in at least one unit of information constituted by an HTML page for example.
  • the system which is the subject of the invention comprises a module for detecting in a plurality of information units the occurrence of at least one variable Vi and a calculation module, for each of these aforementioned variables, of a weighting coefficient or of the values thereof Pik functions of this duration of analysis.
  • the weighting coefficient and each value of the latter are associated with the corresponding variable Vi, according to the relation (1) previously mentioned in the description.
  • a calculation module is provided for calculating, over the duration of analysis ADj, the increase in the values of the weighting coefficient associated with each variable according to the relation (2) previously mentioned in the description.
  • the digital data storage module in the form of a digital data block can be constituted by an application program denoted API, which is loaded into random access memory RAM for execution in order to ensure storage for the duration of the analysis of the HTML pages acquired from each WEB site accessed.
  • API application program
  • the module for detecting the occurrence of at least one variable Vi, the module for calculating for each of these variables a weighting coefficient or the Pik values of the latter, functions of the duration of analysis, the module of calculation over this analysis period of the increase in the weighting coefficient values and the comparator module of this increase to the determined threshold value are the subject of a specific application program, denoted AP2, which is also responsible in RAM working memory for execution and realization of functions according to relations (2) to (5) above.
  • this module can be the subject of an application subroutine AP21, which, following the choice by the manager of the duration of analysis ADj and of the variables Vi assigned to the user, allows a correlation to be made between the so-called reference variables chosen by the latter, and the variables contained in each unit of information, that is to say each HTML page for example.
  • Such a program will not be described in detail since it corresponds to a simple program for calculating auto-correlation functions by bit-by-bit comparison between each reference variable and the content of the information coded in digital form in each HTML page. or information unit.
  • the WS workstation can be provided with a drop-down menu system or with screen pages, which allow the manager, from reference variables Vi stored on the mass memory of the system, to choose the variable or variables retained for the user.
  • a menu is symbolically represented on the display unit DU of the work station WS in FIG. 2a.
  • the reference variables Vi thus chosen are stored in the mass memory HDD previously cited.
  • the launch of the module for detecting the occurrence of the variables Vi makes it possible to count the number of occurrences of each variable Vi during the analysis period ADj.
  • the weighting coefficients and their values are then calculated according to the relation (1) previously mentioned in the description.
  • this module can be integrated into an application sub-program AP22 making it possible to detect the emergence phenomenon for the variables Vi considered according to relation (2) and in accordance with the method which is the subject of the present invention, as described in connection in particular with figures le, ld and le.
  • the module for comparing the above-mentioned increase to a threshold value Si can also be implemented by a comparator module under routine integrated into the aforementioned sub-program AP22.
  • the information unit is constituted by an HTML page for example.
  • the system which is the subject of the present invention can be used to carry out pre-loading operations, also called pre-fetching.
  • the system which is the subject of the invention can be coupled to a search engine, which comprises an operator receiving the URL addresses of the HTML pages in which an emergence phenomenon is detected.
  • the set of URLs obtained can be transmitted via the INTERNET network to a cache memory of a WEB access portal for example, as shown in FIG. 2c.
  • the operations implemented via the search engine are controlled by an application program denoted APx in FIG. 2a and in FIG. 2c.
  • the application program APx is directly called in working memory RAM by the central unit of the system which is the subject of the invention which makes it possible to perform the functions mentioned above in connection with FIG. 2c.
  • the method and the system which are the subject of the present invention can also be used in order to ensure targeted diffusion.
  • the variables Vi for which the phenomenon of emergence has been highlighted by means of the method and the system, objects of the present invention are then stored and used for example by an information distributor to target the programs broadcast. for example.
  • the method and the system, objects of the present invention can be used in order to proceed to recommendations broadcast generally on the INTERNET network for example.
  • the method and the system, objects of the present invention are used for, from variables for which the phenomenon of emergence has been highlighted and a mechanism of recommendations making it possible, from the aforementioned variables, to choose for example URLs or HTML pages, to transmit the aforementioned suggestions or recommendations through the INTERNET network in general or specific to users.

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

The invention relates to a method and a system for detecting an emergence of information phenomenon from sampled digital information-medium data. (A) the duration(ADj) of analysis of the demonstration of the emergence phenomenon is determined; (B) during said period, a weighting coefficient (Pi) is calculated for each information-medium variable (Vi), several values (Pik) thereof being associated with each variable (Vi), (C) during said period (ADj), the increase (ΔPik) in the values of the weighting coefficient is calculated, (D) said increase is compared to a threshold value (Si) associated with each variable. The emergence phenomenon is detected for each variable wherein the increase in the weighting coefficient is greater than the threshold value (Si). The invention can be used in preloading operations for cache memories of Web access portals, for targeted dissemination of information and suggestions to Web users.

Description

PROCEDE ET SYSTEME DE DETECTION D'UN PHENOMENE D'EMERGENCEMETHOD AND SYSTEM FOR DETECTING AN EMERGENCY PHENOMENON
D'INFORMATION A PARTIR DE DONNEES NUMERIQUESINFORMATION FROM DIGITAL DATA
ECHANTILLONNEES .SAMPLES.
Avec l'avènement de l'échange d'information par voie numérique, par échange de messages ou d'accès en réseau, le comportement des utilisateurs de ces moyens d'échange a fait l'objet de nombreuses investigations.With the advent of the exchange of information by digital means, by exchange of messages or network access, the behavior of the users of these means of exchange has been the subject of numerous investigations.
C'est en particulier le cas dans le domaine du commerce électronique dans lequel il est opportun de déterminer, et, de préférence, d'anticiper les centres d'intérêt, et, finalement les comportements raisonnablement prévisibles d'un ou plusieurs utilisateurs. Alors que de manière connue en tant que telle, indépendamment du domaine spécifique au commerce électronique, les études statistiques permettent une approche globale, relative à des groupements d'individus ou utilisateurs, la présente invention a, au contraire, pour objet, un procédé et un système de détection d'un phénomène d'émergence d'information, à partir de données numériques échantillonnées, susceptibles d'être mis en œuvre de manière discrète, par utilisateur, une mise en œuvre pour un groupe d'utilisateurs, voire une population d'utilisateurs, pouvant simplement être ramenée à une multiplication de mise en œuvre du procédé respectivement du système objet de la présente invention, afin d'en inférer des résultats statistiques.This is particularly the case in the field of electronic commerce in which it is advisable to determine, and preferably to anticipate the centers of interest, and ultimately the reasonably foreseeable behavior of one or more users. While in a manner known as such, independently of the specific field of electronic commerce, statistical studies allow a global approach, relating to groups of individuals or users, the present invention, on the contrary, has for its object, a method and a system for detecting a phenomenon of emergence of information, from sampled digital data, capable of being implemented discreetly, per user, an implementation for a group of users, or even a population of users, which can simply be reduced to a multiplication of implementation of the method respectively of the system object of the present invention, in order to infer statistical results.
Toute information désignant, selon l'acception la plus large, le fait ou la chose que l'on porte à la connaissance de quelqu'un, dans le cadre d'études comportementales, l'émergence d'informations, de toute nature, est en effet significative de tendances de comportement d'individus ou de groupes d'individus.Any information designating, in the broadest sense, the fact or thing that comes to the knowledge of someone, in the context of studies Behavioral, the emergence of information, of any kind, is indeed significant of behavioral patterns of individuals or groups of individuals.
Dans le cadre de l'application plus spécifique des études comportementales d'utilisateurs du commerce électronique, les méthodes spécifiques d'étude comportementale des utilisateurs correspondent à des méthodes de pré-chargement, ou "pre-fetching" en langage anglo-saxon, dans lesquelles l'on pré-charge des informations qui sont susceptibles d'être utilisées par les utilisateurs.Within the framework of the more specific application of the behavioral studies of users of electronic commerce, the specific methods of behavioral study of the users correspond to methods of preloading, or "pre-fetching" in Anglo-Saxon language, in which pre-load information that is likely to be used by users.
Les méthodes de pré-chargement actuelles précitées peuvent être classées en deux types principaux :The aforementioned current preloading methods can be classified into two main types:
- un premier type consiste à analyser les fichiers HTML consultés ;- a first type consists in analyzing the HTML files consulted;
- un deuxième type consiste à faire appel à des méthodes statistiques, telles que mentionnées précédemment.- a second type consists of using statistical methods, as mentioned above.
Parmi le premier type de méthode, on peut citer le système WWW Collector, disponible à partir du site WEB http: //shika.aist-nava.ac . jp/products/wcol/wcol .html .Among the first type of method, we can cite the WWW Collector system, available from the WEB site http: //shika.aist-nava.ac. jp / products / wcol / wcol .html.
Un tel système met en œuvre un proxy cache analysant les fichiers HTML reçus par l'utilisateur et effectue un chargement des documents qui sont inclus, ou dont l'adresse est incluse, c'est-à-dire mémorisés, dans le proxy.Such a system implements a cache proxy analyzing the HTML files received by the user and makes a loading of the documents which are included, or whose address is included, that is to say stored, in the proxy.
On peut également citer le système Cache Flow disponible à partir de l'adresse du site WEB http: //www. cacheflow.com. Ce système consiste en un proxy ou cache matériel qui fonctionne avec l'environnement désigné par CacheOS. Un tel environnement met en œuvre un pré-chargement prédictif qui prévoit de pré-charger les objets WEB qui ne figurent pas dans le cache matériel et qui sont inclus dans les documents demandés par les utilisateurs, tels que les images en ligne.We can also cite the Cache Flow system available from the WEB site address http: // www. cacheflow.com. This system consists of a proxy or hardware cache that works with the environment designated by CacheOS. Such an environment implements a predictive preload which provides for preloading the WEB objects that are not in the hardware cache and that are included in documents requested by users, such as online images.
D'autres systèmes présentent des fonctions similaires tels que le système Netsonic . Pro, disponible à partir du site WEB : http : //www.web3000. com/produits/NetSonicpro/ , et le système WebEarly3 , disponible à partir du site WEB ht p : //www. goto . fr/ACH/achpreswe .htm. Ces derniers systèmes constituent de petits programmes utilitaires qui fonctionnent en complément d'un navigateur en local et qui pré-chargent les documents HTML dont les liens apparaissent dans les documents HTML en cours de consultation. Parmi les deuxièmes types de méthodes, le processus de pré-chargement est basé sur des études statistiques des successions d'URL, pour Universal Resource Locator, en utilisant les historiques de connexion. Dans l'article intitulé "Using Spéculation toOther systems have similar functions such as the Netsonic system. Pro, available from the WEB site: http: //www.web3000. com / products / NetSonicpro /, and the WebEarly3 system, available from the WEB site ht p: // www. goto. com / ACH / achpreswe .htm. These latter systems are small utility programs that work in addition to a local browser and that preload HTML documents whose links appear in HTML documents being viewed. Among the second types of methods, the preloading process is based on statistical studies of URL successions, for Universal Resource Locator, using connection histories. In the article titled "Using Speculation to
Reduce Server Load and Service Time on the WWW" publié par Azer BESTAVROS, Proceedings of CIKM's95 : The Fourth ACM International Conférence on Information and Knowledge Management, Baltimore, MD, Novembre 1995, il est proposé d'utiliser une matrice sur le serveur distant. Chaque élément P(i,j) de cette matrice correspond à la probabilité qu'un utilisateur consultant le document Di se rende sur le document Dj en un temps inférieur à une valeur T constante. Les valeurs des éléments P(i,j) de cette matrice, représentatifs des valeurs de probabilité, sont calculées à l'aide des accès des précédents clients sur ce même serveur.Reduce Server Load and Service Time on the WWW "published by Azer BESTAVROS, Proceedings of CIKM's95: The Fourth ACM International Conference on Information and Knowledge Management, Baltimore, MD, November 1995, it is proposed to use a matrix on the server Each element P (i, j) of this matrix corresponds to the probability that a user consulting the document Di goes to the document Dj in a time less than a constant value T. The values of the elements P (i, j ) of this matrix, representative of the probability values, are calculated using the accesses of previous clients on this same server.
Enfin, il existe des méthodes semblables utilisant des profils de groupes d'utilisateurs ainsi que décrit dans l'article intitulé "Determining WWW User ' s Next Access and i ts Application to Pre-fetching" publié par Carlos R. CUNHA et Carlos F.B. JACCOUD. Proceedings of the IEEE Symposium on Computers and Communications (ISCC'97), Alexandrie, Egypte, Juillet 1997. La présente invention a pour objet la mise en œuvre d'un procédé et d'un système de détection d'un phénomène d'émergence d'information à partir de données numériques échantillonnées, applicables de manière non limitative au pré-chargement ou pre-fetching. En particulier, le procédé et le système objets de la présente invention se distinguent des procédés et systèmes de l'art antérieur précités en raison du fait, d'une part, qu'aucun pré-chargement des liens des pages HTML demandées par les utilisateurs et que, d'autre part, aucun calcul statistique sur les successions d'URL accédées, n'est réalisé.Finally, there are similar methods using user group profiles as described in the article "Determining WWW User 's Next Access and i ts Application to Pre-fetching" published by Carlos R. CUNHA and Carlos F.B. JACCOUD. Proceedings of the IEEE Symposium on Computers and Communications (ISCC'97), Alexandria, Egypt, July 1997. The present invention relates to the implementation of a method and a system for detecting an emergence phenomenon information from sampled digital data, applicable without limitation to pre-loading or pre-fetching. In particular, the method and the system which are the subject of the present invention are distinguished from the aforementioned methods and systems of the prior art due to the fact, on the one hand, that no preloading of the links of the HTML pages requested by the users and that, on the other hand, no statistical calculation on the successions of URLs accessed is performed.
Un objet de la présente invention est, au contraire, la mise en œuvre d'un procédé et d'un système de détection d'un phénomène d'émergence d'information, à partir de données numériques échantillonnées, par discrimination des centres d'intérêt des utilisateurs.An object of the present invention is, on the contrary, the implementation of a method and a system for detecting a phenomenon of emergence of information, from sampled digital data, by discrimination of data centers. user interest.
Un autre objet de la présente invention est la mise en œuvre d'un procédé et d'un système de détection d'un phénomène d'émergence d'information permettant une présélection semantiquement orientée de portions du WEB cohérentes avec les intérêts des utilisateurs. Le procédé de détection d'un phénomène d'émergence d'information, à partir de données numériques échantillonnées, support de cette information, objet de la présente invention, est remarquable en ce qu'il consiste, pour une pluralité de variables support de cette information : à définir une durée d'analyse de mise en évidence de ce phénomène d ' émergence ; à calculer sur cette durée d'analyse, pour chacune des variables, un coefficient de pondération fonction de cette durée, une ou plusieurs valeurs de ce coefficient de pondération étant associée (s) à chaque variable considérée ; à calculer sur cette durée d'analyse l'accroissement des valeurs du coefficient de pondération associées à chaque variable ; à comparer cet accroissement à une valeur de seuil déterminée, spécifique à chaque variable.Another object of the present invention is the implementation of a method and a system for detecting a phenomenon of emergence of information allowing a semantically oriented preselection of portions of the WEB consistent with the interests of the users. The method of detecting a phenomenon of emergence of information, from sampled digital data, medium of this information, object of the present invention, is remarkable in that it consists, for a plurality of variables medium of this information: to define a duration of analysis to highlight this phenomenon of emergence; calculating over this analysis duration, for each of the variables, a weighting coefficient as a function of this duration, one or more values of this weighting coefficient being associated with each variable considered; calculating over this analysis period the increase in the values of the weighting coefficient associated with each variable; to compare this increase with a determined threshold value, specific to each variable.
Le phénomène d'émergence d'information est détecté pour toute variable dont l'accroissement des valeurs du coefficient de pondération est supérieur à la valeur de seuil déterminée spécifique.The phenomenon of information emergence is detected for any variable whose increase in the weighting coefficient values is greater than the specific determined threshold value.
Le système de détection d'un phénomène d'émergence d'information à partir de données numériques échantillonnées support de cette information, objet de l'invention, est remarquable en ce qu'il comporte au moins : un module de mémorisation, sur au moins une durée d'analyse, des données numériques sous forme de blocs de données numériques, constitutives d'unités d'information ; - une base de données contenant une pluralité de variables de référence, chaque variable étant représentative d'un événement susceptible d'être mis en évidence dans au moins une unité d'information ; - un module de détection dans une pluralité d'unités d'information de l'occurrence d'au moins une variable ; un module de calcul, pour chacune de ces variables, d'un coefficient de pondération fonction de cette durée d'analyse, ce coefficient de pondération étant associé à cette variable et mémorisé dans la base de données ; un module de calcul, sur cette durée d'analyse, de l'accroissement des valeurs du coefficient de pondération associées à chaque variable ; un module comparateur de cet accroissement à une valeur de seuil déterminée, spécifique à chaque variable.The system for detecting a phenomenon of emergence of information from sampled digital data supporting this information, object of the invention, is remarkable in that it comprises at least: a storage module, on at least a duration of analysis, digital data in the form of digital data blocks, constituting information units; - a database containing a plurality of reference variables, each variable being representative of an event capable of being highlighted in at least one information unit; - a detection module in a plurality of information units of the occurrence of at least one variable; a module for calculating, for each of these variables, a weighting coefficient as a function of this duration of analysis, this weighting coefficient being associated with this variable and stored in the database; a module for calculating, over this analysis period, the increase in the values of the weighting coefficient associated with each variable; a comparator module of this increase to a determined threshold value, specific to each variable.
Le procédé et le système de détection d'un phénomène d'émergence d'information à partir de données numériques échantillonnées, objet de la présente invention, trouvent application non seulement au processus de pré-chargement précédemment décrit dans la description, lors de l'accès à des pages HTML ou à des sites WEB par des utilisateurs, mais encore lors de l'accès à des programmes vidéo ou audiovisuels par l'intermédiaire de réseaux de télédiffusion. Ils seront mieux compris à la lecture de la description et à l'observation des dessins ci -après dans lesquels : la figure la représente, à titre illustratif, un organigramme des étapes essentielles permettant la mise en œuvre du procédé de détection d'un phénomène d'émergence d'information conforme à l'objet de la présente invention ; la figure lb représente, à titre illustratif, un schéma d'organisation des variables support de l'information dont l'émergence doit être mise en évidence, grâce à la mise en œuvre du procédé objet de l'invention ; les figures le et ld représentent, à titre illustratif, un diagramme temporel de l'évolution de valeurs de coefficients de pondération affectés à une variable support de cette information constituée par une première variable thématique "Auto" , respectivement par une deuxième variable thématique "Végétal" ; la figure le représente, à titre illustratif, un diagramme temporel explicitant le mode de calcul de la valeur de seuil spécifique associée à chaque variable support d'information ; la figure 2a représente, à titre illustratif, l'architecture générale d'un système de détection d'un phénomène d'émergence d'information, objet de l'invention, plus particulièrement destiné à une utilisation sur le réseau INTERNET, chaque unité d'information étant constituée par une page HTML acquise à partir d'un site WEB ; les figures 2b à 2e représentent, à titre illustratif, différents exemples d'utilisation du système objet de l'invention, tel qu'illustré en figure 2a.The method and the system for detecting a phenomenon of emergence of information from sampled digital data, object of the present invention, find application not only to the preloading process previously described in the description, during the access to HTML pages or WEB sites by users, but also when accessing video or audiovisual programs via television broadcasting networks. They will be better understood on reading the description and on observing the drawings below in which: the figure represents it, by way of illustration, a flow diagram of the essential steps allowing the implementation of the method for detecting a phenomenon emergence of information in accordance with the object of the present invention; FIG. 1b represents, by way of illustration, a diagram of the organization of the information support variables whose emergence must be demonstrated, by virtue of the implementation of the method which is the subject of the invention; FIGS. le and ld represent, by way of illustration, a time diagram of the evolution of values of weighting coefficients assigned to a support variable of this information constituted by a first thematic variable "Auto", respectively by a second thematic variable "Vegetal""; the figure represents it, by way of illustration, a time diagram explaining the method of calculating the specific threshold value associated with each information carrier variable; FIG. 2a represents, by way of illustration, the general architecture of a system for detecting a phenomenon of information emergence, object of the invention, more particularly intended for use on the INTERNET network, each unit of information consisting of an HTML page acquired from a WEB site; FIGS. 2b to 2e represent, by way of illustration, different examples of use of the system which is the subject of the invention, as illustrated in FIG. 2a.
Une description plus détaillée d'un mode de mise en œuvre du procédé de détection d'un phénomène d'émergence d'information, objet de la présente invention, sera maintenant donnée en liaison avec les figures la à le. D'une manière générale, le procédé, objet de la présente invention, consiste en un étape de départ, notéeA more detailed description of an embodiment of the method for detecting a phenomenon of emergence of information, object of the present invention, will now be given in conjunction with FIGS. In general, the process which is the subject of the present invention consists of a starting step, noted
S, dans laquelle les données échantillonnées D support de l'information sont disponibles ou acquises et où, en outre, l'on dispose de variables supports, une pluralité de variables supports notés [Ni lj pouvant être définies par un utilisateur du procédé, objet de l'invention.S, in which the sampled data D information support is available or acquired and where, in addition, there are support variables, a plurality of support variables denoted [Ni l j can be defined by a user of the method, subject of the invention.
Les données numériques échantillonnées étant a priori quelconques et pouvant consister en des données numériques de texte ou, le cas échéant, d'images, image "bitmap" par exemple, on indique que les variables supports de l'information, les variables Vi, peuvent être constituées par des chaînes de caractères, des logos, des marques de fabrique et finalement par tout objet informatique susceptible d'être contenu et reconnu dans les données numériques échantillonnées précitées.The digital data sampled being a priori arbitrary and possibly consisting of digital data of text or, where appropriate, of images, "bitmap" image for example, it is indicated that the information carrier variables, the variables Vi, can be made up of character strings, logos, trademarks and finally by any computer object likely to be contained and recognized in the aforementioned sampled digital data.
Suite à l'étape S de départ précitée, le procédé, objet de l'invention, consiste en une étape A à définir une durée d'analyse de mise en évidence du phénomène d'émergence.Following the aforementioned starting step S, the method which is the subject of the invention consists of a step A to define a duration of analysis to demonstrate the phenomenon of emergence.
L'étape A précitée peut consister à introduire une durée d'analyse ADj constituée soit par une plage temporelle définie par deux dates exprimées par exemple en années, mois et jours, ou, le cas échéant, en nombre d'accès à un ou plusieurs sites WEB , par exemple, ou même, le cas échéant, en nombre de pages HTML acquises à partie d'un ou plusieurs sites WEB précités.The aforementioned step A can consist in introducing a duration of analysis ADj constituted either by a time range defined by two dates expressed for example in years, months and days, or, if necessary, in number of accesses to one or more WEB sites, for example, or even, where appropriate, in number of HTML pages acquired from one or more of the aforementioned WEB sites.
L'étape A est alors suivie d'une étape B consistant à calculer sur la durée d'analyse ADj et pour chacune des variables Vi, un coefficient de pondération fonction de la durée d'analyse ADj. Dans un mode de mise en œuvre spécifique préférentiel non limitatif, on indique que le coefficient de pondération précité peut prendre, sur la valeur d'analyse ADj, plusieurs valeurs notées Pik de ce coefficient, l'ensemble de ces valeurs et le coefficient correspondant étant alors associés à chaque variable Vi considérée .Step A is then followed by a step B consisting in calculating over the duration of analysis ADj and for each of the variables Vi, a weighting coefficient as a function of the duration of analysis ADj. In a non-limiting preferential specific implementation mode, it is indicated that the aforementioned weighting coefficient can take, on the analysis value ADj, several values denoted Pik of this coefficient, all of these values and the corresponding coefficient being then associated with each variable Vi considered.
Sur la figure la, l'ensemble des valeurs du coefficient de pondération noté [Pik]k=ι est associé à chaque variable Vi considérée selon la relation (1) :In FIG. 1 a, the set of values of the weighting coefficient noted [Pik] k = ι is associated with each variable Vi considered according to relation (1):
Figure imgf000011_0001
Figure imgf000011_0001
D'une manière générale, on indique que les valeurs de chaque coefficient de pondération, valeurs Pik, correspondent à des valeurs de calcul de ce coefficient à des instants de calcul k, k étant compris entre la valeur 1 et la valeur K, la valeur K dépendant essentiellement de la durée d'analyse ADj, ainsi qu'il sera décrit de manière plus détaillée ultérieurement dans la description.In general, it is indicated that the values of each weighting coefficient, Pik values, correspond to calculation values of this coefficient at instants of calculation k, k being between the value 1 and the value K, the value K depends essentially on the duration of analysis ADj, as will be described in more detail later in the description.
Sur la figure la, l'accroissement des valeurs du coefficient de pondération est noté selon la relation (2) :In FIG. 1a, the increase in the values of the weighting coefficient is noted according to equation (2):
[ΔPik ïj1 = [Pik - Pik - 1 βï ( 2 )[ΔPik ïj 1 = [Pik - Pik - 1 βï (2)
En référence à la relation précitée, on indique que les valeurs d'accroissement du coefficient de pondération sont calculées successivement entre deux valeurs du coefficient de pondération successives de rang adjacent k-1 et k. L'étape C est alors suivie d'une étape D, étape de tests consistant à comparer l'accroissement précité à une valeur de seuil déterminée, spécifique à chaque variable Vi. L'opération de comparaison est donnée par la relation (3) :With reference to the above-mentioned relation, it is indicated that the values of increase of the weighting coefficient are calculated successively between two values of the successive weighting coefficient of adjacent rank k-1 and k. Step C is then followed by step D, test step consisting in comparing the above-mentioned increase with a determined threshold value, specific to each variable Vi. The comparison operation is given by equation (3):
[ΔPik]) Si (3)[ΔPik]) If (3)
Dans cette relation, on indique que Si représente la valeur de seuil déterminée spécifique à la variable Vi et [ΔPik] représente l'ensemble des valeurs d'accroissement du coefficient de pondération associé à la variable Vi précitée . On comprend ainsi, selon un mode de réalisation non limitatif du procédé objet de la présente invention, que le phénomène d'émergence de l'information supportée par la variable Vi est mis en évidence lorsque l'une au moins des valeurs d'accroissement ΔPik sur la période d'analyse ADj est supérieure à la valeur de seuil Si précédemment mentionnée.In this relation, it is indicated that Si represents the determined threshold value specific to the variable Vi and [ΔPik] represents the set of values of increase in the weighting coefficient associated with the aforementioned variable Vi. It is thus understood, according to a non-limiting embodiment of the method which is the subject of the present invention, that the phenomenon of emergence of the information supported by the variable Vi is highlighted when at least one of the increase values ΔPik over the analysis period ADj is greater than the threshold value Si previously mentioned.
Ainsi, sur réponse positive à l'étape de tests D, le phénomène d'émergence d'informations est détecté pour toute variable Vi dont l'accroissement des valeurs du coefficient de pondération et, au moins, l'une de ces valeurs d'accroissement est supérieure à la valeur de seuil Si. Dans ces conditions, la variable Vi considérée peut alors être classée et mémorisée comme appartenant à un ensemble de variables émergentes, notées Evi, pour lesquelles le phénomène d'émergence a été mis en évidence. L'ensemble Evi peut être constitué soit par une liste des variables émergentes, soit par un répertoire contenant l'ensemble des variables émergentes.Thus, on a positive response to the test step D, the phenomenon of emergence of information is detected for any variable Vi including the increase in the values of the weighting coefficient and, at least, one of these values of increase is greater than the threshold value Si. Under these conditions, the variable Vi considered can then be classified and stored as belonging to a set of emerging variables, denoted Evi, for which the phenomenon of emergence has been highlighted. The Evi set can be made up either of a list of emerging variables, or by a directory containing all the emerging variables.
Au contraire, sur réponse négative aux tests de l'étape D, aucun des accroissements du coefficient de pondération n'étant supérieur à la valeur de seuil Si, un retour par une étape F peut être prévu, soit vers l'étape de départ S, par l'intermédiaire d'une sous-étape FI, soit vers l'étape A,' par l'intermédiaire d'une sous étape F2. Le passage et le choix à la sous étape FI ou F2 peut être laissé au choix de l'utilisateur, par l'intermédiaire d'une commande de choix, notée T sur la figure la.On the contrary, on a negative response to the tests of step D, none of the increases in the weighting coefficient being greater than the threshold value Si, a return by a step F can be expected, ie towards the starting step S , via a sub-step FI, or towards step A, 'via a sub-step F2. The passage and the choice to the sub-step FI or F2 can be left to the choice of the user, by means of a choice command, noted T in FIG.
D'une manière générale, on indique que le retour à l'étape S de départ permet par l'utilisateur la redéfinition d'une ou plusieurs variables Vi, puis bien entendu successivement, lors de l'appel de l'étape A, d'une nouvelle durée d'analyse, alors que le simple retour par la sous étape F2 à l'étape A permet uniquement la seule redéfinition de la durée d'analyse ADj. Lorsque la durée d'analyse n'est pas définie par une valeur temporelle, cette durée d'analyse ADj peut avantageusement être définie comme un nombre, en l'occurrence un nombre d'événements générateurs de l'information recherchée, c'est-à-dire de l'information pour laquelle le phénomène d'émergence doit être mis en évidence. Ce nombre, en l'occurrence, peut se ramener à un nombre de pages HTML par exemple lorsque le procédé, objet de la présente invention, est mis en œuvre dans le cadre de l'accès à des sites WEB sur le réseau INTERNET.In general, it is indicated that the return to the starting step S allows the user to redefine one or more variables Vi, then of course successively, when calling step A, d 'a new analysis time, while the simple return by the sub-step F2 to step A only allows the only redefinition of the analysis time ADj. When the duration of analysis is not defined by a time value, this duration of analysis ADj can advantageously be defined as a number, in this case a number of events generating the information sought, that is to say ie information for which the phenomenon of emergence must be highlighted. This number, in this case, can be reduced to a number of HTML pages for example when the method, object of the present invention, is implemented in the context of access to WEB sites on the INTERNET network.
D'une manière avantageuse, afin d'assurer la mise en œuvre du procédé objet de la présente invention, et ainsi que représenté en figure lb, les variables Vi peuvent être choisies parmi des types de variables distinctes, notées Typ, ces types de variables pouvant être classés en variables thématiques, variables comportementales et variables de contexte ou, le cas échéant, de support ainsi qu'il sera décrit ci-après.Advantageously, in order to ensure the implementation of the process which is the subject of the present invention, and as shown in FIG. 1b, the variables Vi can be chosen from different types of variables, noted Typ, these types of variables can be classified into thematic variables, behavioral variables and context variables or, where appropriate, of support as will be described below.
Sur la figure lb, on a représenté des variables de types précités, lesquelles, à titre d'exemple non limitatif, sont désignées par :In FIG. 1b, variables of the aforementioned types have been represented, which, by way of nonlimiting example, are designated by:
variables thématiques o VI "Végétal " o V2 "Animal " o V3 "Auto", cette dernière variable thématique désignant le thème de l'automobile par exemple.thematic variables o VI "Vegetal" o V2 "Animal" o V3 "Auto", the latter thematic variable designating the theme of the automobile for example.
variables comportementales o V4 "Action " o V5 "Suspens " o V6 "Humour", encore désignée par rire, o V7. "Classique " o V8 "Pop"behavioral variables o V4 "Action" o V5 "Suspense" o V6 "Humor", also designated by laughter, o V7. "Classic" o V8 "Pop"
variables de contexte ou de support o V9. "Film" o V10. "Documentaire" o Vil. "Sport".context or support variables o V9. "Film" o V10. "Documentary" o Vil. "Sport".
Un exemple de mise en oeuvre du procédé, objet de l'invention, et, en particulier du calcul du coefficient de pondération pour différentes variables, telles que les variables d'un même type, sera maintenant donné en liaison avec les figures le et ld.An example of implementation of the method, object of the invention, and, in particular of the calculation of the weighting coefficient for different variables, such as variables of the same type, will now be given in conjunction with figures le and ld.
D'une manière générale, on indique qu'un ensemble de variables est attaché à un utilisateur. Cet utilisateur définit ou reçoit cet ensemble de variables, ainsi que mentionné précédemment dans la description, à l'étape S.In general, we indicate that a set of variables is attached to a user. This user defines or receives this set of variables, as mentioned previously in the description, in step S.
L'exemple précité sera donné dans le cas où les variables mentionnées sont constituées ,à titre d'exemple non limitatif, par des chaînes de caractères, c'est-à-dire des mots de la langue utilisés par l'utilisateur, ainsi que décrit précédemment dans la description en liaison avec la figure lb.The above example will be given in the case where the variables mentioned consist, by way of nonlimiting example, of character strings, that is to say words of the language used by the user, as well as described previously in the description in conjunction with Figure lb.
Chacune des chaînes de caractères ou mots est affectée du coefficient de pondération reflétant le niveau de consultation, c'est-à-dire l'importance de cette variable pour l'utilisateur considéré.Each character or word chain is assigned a weighting coefficient reflecting the level of consultation, that is to say the importance of this variable for the user considered.
A titre d'exemple non limitatif, on indique que le coefficient de pondération et, en particulier, les valeursBy way of nonlimiting example, it is indicated that the weighting coefficient and, in particular, the values
Pik peuvent correspondre à une valeur de fréquence relative de l'occurrence de la variable Vi considérée sur la durée d'analyse ADj.Pik can correspond to a relative frequency value of the occurrence of the variable Vi considered over the analysis duration ADj.
Ces valeurs de pondération sont représentées, sur les figures le et ld, pour deux variables thématiques correspondant, par exemple, au mot "Auto" et au mot " Végétal " ou à un mot ayant un rapport direct avec le motThese weighting values are represented, in FIGS. Le and ld, for two thematic variables corresponding, for example, to the word "Auto" and to the word "Vegetal" or to a word having a direct relationship with the word
" Végétal " ."Vegetal".
En effet, on indique à titre d'exemple non limitatif et, afin de conférer une portée générale aux variables thématiques précitées, que chaque variable thématique peut en fait couvrir un ensemble de sous- variables thématiques appartenant bien entendu au même thème, sous-variables telles que : arbre, fleur, ou autre pour la variable thématique "végétal " .Indeed, it is indicated by way of nonlimiting example and, in order to give a general scope to the aforementioned thematic variables, that each thematic variable can in fact cover a set of thematic sub-variables of course belonging to the same theme, sub-variables such as: tree, flower, or other for the thematic variable "plant".
Dans un mode de réalisation non limitatif, on indique que, à chaque variable d'un type donné, tel que le type thématique, peut ainsi être associée une liste de sous-variables appartenant au même type.In a nonlimiting embodiment, it is indicated that, with each variable of a given type, such as the thematic type, a list of sub-variables belonging to the same type can thus be associated.
Les coefficients de pondération et les valeurs Pik de ces derniers sont alors calculés par itération au fur et à mesure que l'utilisateur accède à un élément d'information, tel qu'une page HTML par exemple, élément qui peut être décrit par les variables Vi correspondantes.The weighting coefficients and the Pik values of the latter are then calculated by iteration as the user accesses an item of information, such as an HTML page for example, an item which can be described by the variables. Vi corresponding.
Un exemple est donné ci-après pour une variable thématique "Auto" et une sous-variable "Arbre " appartenant à la liste des sous-variables associées à la variable thématique "Végétal". Selon quatre étapes successives représentées par des tableaux Tl à T4 correspondant aux instants k de calcul du coefficient de pondération :An example is given below for a thematic variable "Auto" and a sub-variable "Tree" belonging to the list of sub-variables associated with the thematic variable "Vegetal". According to four successive stages represented by tables Tl to T4 corresponding to the instants k of calculation of the weighting coefficient:
Tableau Tl pour k=l du calcul du coefficient de pondération.Table Tl for k = l of the calculation of the weighting coefficient.
Figure imgf000016_0002
Figure imgf000016_0003
Figure imgf000016_0004
Figure imgf000016_0002
Figure imgf000016_0003
Figure imgf000016_0004
L'utilisateur visionne un film d'action sur les automobiles .The user watches an action film on automobiles.
Figure imgf000016_0001
Tableau T2 correspondant à l'instant k=2 du calcul de coefficient de pondération
Figure imgf000016_0001
Table T2 corresponding to time k = 2 of the weighting coefficient calculation
Figure imgf000017_0001
Figure imgf000017_0002
Figure imgf000017_0003
Figure imgf000017_0001
Figure imgf000017_0002
Figure imgf000017_0003
L'utilisateur consulte un document sur les arbres, et donc les végétaux.The user consults a document on trees, and therefore plants.
Tableau T3 à l'instant k=3 du calcul du coefficient de pondération.Table T3 at time k = 3 of the calculation of the weighting coefficient.
Figure imgf000017_0004
Figure imgf000017_0005
Figure imgf000017_0006
Figure imgf000017_0004
Figure imgf000017_0005
Figure imgf000017_0006
L'utilisateur consulte un document sur les automobiles.The user views a document on automobiles.
Tableau T4 à l'instant k=4 du calcul du coefficient de pondération.Table T4 at time k = 4 of the calculation of the weighting coefficient.
Figure imgf000017_0007
Figure imgf000017_0008
Figure imgf000017_0009
Figure imgf000017_0007
Figure imgf000017_0008
Figure imgf000017_0009
L'utilisateur consulte une émission sur le sport automobile.The user views a program on motorsport.
L'ensemble de ces valeurs de pondération représente un espace algébrique multidimensionnel dans lequel évolue le profil global de l'utilisateur. On comprend, en particulier, que les valeurs indiquées dans les tableaux précités peuvent correspondre à des valeurs d'occurrence réelle des variables ou types de variables correspondantes . Ces valeurs peuvent correspondre à des valeurs d'occurrence absolue ou, le cas échéant, à des valeurs d'occurrences ou de fréquences relatives ramenées au nombre de variables détectées .The set of these weighting values represents a multidimensional algebraic space in which evolves the overall profile of the user. It is understood, in particular, that the values indicated in the aforementioned tables can correspond to values of real occurrence of the variables or types of corresponding variables. These values can correspond to absolute occurrence values or, where appropriate, to occurrence or relative frequency values reduced to the number of detected variables.
Les différents types de variables ainsi que les relations entre ces types et ces variables sont stockées dans une base de données, de manière à permettre la reconstitution de la chronologie d'évolution du coefficient de pondération de chaque variable Vi .The different types of variables as well as the relationships between these types and these variables are stored in a database, so as to allow the reconstruction of the chronology of evolution of the weighting coefficient of each variable Vi.
Le processus de détection du phénomène d'émergence, tel que décrit en liaison avec les étapes B et C de la figure la sera maintenant explicité en liaison avec les figures le et ld relativement à deux variables thématiques prises égales à titre d'exemple non limitatif au mot "Auto" respectivement au mot "Arbre", la variable "Arbre" correspondant à la variable thématique "Végétal" pour les raisons indiquées précédemment dans la description.The process of detecting the phenomenon of emergence, as described in connection with steps B and C of FIG. 1a will now be explained in connection with FIGS. 1 and 1d relative to two thematic variables taken equal by way of nonlimiting example to the word "Auto" respectively to the word "Tree", the variable "Tree" corresponding to the thematic variable "Vegetal" for the reasons indicated previously in the description.
Sur les figures précitées, on a représenté un diagramme temporel des valeurs des coefficients de pondération correspondant aux variables précitées. Ce diagramme temporel est gradué, en abscisses, en valeur temporelle, c'est-à-dire en valeur d'instant de calcul k du coefficient de pondération Pik correspondant pour la variable Vi="Auto" respectivement "Arbre" ou "Végétal" ainsi que mentionné précédemment. Il est gradué en valeur d'occurrence relative en ordonnées. A l'observation de la figure le, on constate de la manière la plus nette que le thème "Auto" est dominant par rapport au thème "Arbre" en raison de l'accroissement très sensible d'une valeur de pondération Pik pour la variable "Auto" sur le temps d'analyse ADj.The above figures show a time diagram of the values of the weighting coefficients corresponding to the above variables. This time diagram is graduated, on the abscissa, in time value, that is to say in time value of calculation k of the weighting coefficient Pik corresponding for the variable Vi = "Auto" respectively "Tree" or "Vegetal" as previously mentioned. It is graduated in relative occurrence value on the ordinate. When we observe Figure le, we can see most clearly that the "Auto" theme is dominant compared to the "Tree" theme due to the very significant increase in a Pik weighting value for the variable "Auto" on the analysis time ADj.
Le processus de détection des phénomènes d'émergence est alors le suivant : pour un intervalle de temps donné, c'est-à-dire pour une durée d'analyse ADj donnée, et pour chacune des variables Vi, on calcule l'accroissement du coefficient de pondération précité selon la relation 2 précédemment donnée dans la description.The process for detecting emergence phenomena is as follows: for a given time interval, that is to say for a given analysis time ADj, and for each of the variables Vi, the increase in the aforementioned weighting coefficient according to relation 2 previously given in the description.
En ce qui concerne la valeur de seuil Si associée à chaque variable Vi, on indique que cette valeur de seuil peut être calculée, pour chaque utilisateur, en fonction des habitudes de ce dernier.Regarding the threshold value Si associated with each variable Vi, it is indicated that this threshold value can be calculated, for each user, according to the habits of the latter.
Un mode de calcul spécifique de cette valeur de seuil, pour chacune des variables choisies par ou affectées à l'utilisateur, est maintenant décrit en liaison avec la figure le.A specific method of calculating this threshold value, for each of the variables chosen by or assigned to the user, is now described in connection with FIG.
En référence à la figure précitée, pour une analyse successive de la pluralité de variables support de l'information dont le phénomène d'émergence doit être mis en évidence, cette analyse est conduite sur une pluralité d'analyses élémentaires successives ADj avec j e [1,7] sur l'exemple non limitatif de la figure le.With reference to the aforementioned figure, for a successive analysis of the plurality of information support variables whose emergence phenomenon must be highlighted, this analysis is conducted on a plurality of successive elementary analyzes ADj with i [1 , 7] in the nonlimiting example of FIG.
On définit sur chaque durée d'analyse élémentaire ADj une valeur d'accroissement, moyenne du coefficient de pondération associée à la variable i considérée. Cette valeur moyenne étant notée ΔPij, ainsi que représenté sur la figure le. Les valeurs moyennes des accroissements des valeurs des coefficients de pondération sont notées, en conséquence, ΔPil à ΔPi7.For each elementary analysis period ADj, an increase value is defined, which is the average of the weighting coefficient associated with the variable i considered. This average value being noted ΔPij, as shown in Figure le. The average values of the increases in the values of the weighting coefficients are denoted, consequently, ΔPil to ΔPi7.
Dans un mode de réalisation spécifique, on indique que la valeur de seuil Si spécifique à chaque variable Vi est prise égale à la moyenne des accroissements des valeurs de coefficients de pondération calculés pour les durées d'analyse antérieures et/ou postérieures à une durée d'analyse courante par exemple. Dans un premier exemple de mise en œuvre, on indique que le calcul de la valeur moyenne peut porter sur le nombre de durée d'analyses élémentaires prises en compte, nombre J. La valeur de ces valeurs de seuil Si pour la variable Vi considérée vérifie alors la relation (4) : i J=J In a specific embodiment, it is indicated that the threshold value Si specific to each variable Vi is taken equal to the average of the increases in the values of weighting coefficients calculated for the durations of analysis prior and / or subsequent to a duration d current analysis for example. In a first example of implementation, it is indicated that the calculation of the average value can relate to the number of duration of elementary analyzes taken into account, number J. The value of these threshold values Si for the variable Vi considered satisfies then the relation (4): i J = J
Si = y∑ΔPijIf = y ∑ΔPij
Le cas échéant, la valeur de seuil Si spécifique à chaque variable Vi peut également être prise égale à la moyenne pondérée des accroissements des valeurs des coefficients de pondération calculés pour les durées d'analyses antérieures et/ou postérieures à une durée d'analyse courante et vérifier ainsi la relation (5) :If necessary, the threshold value Si specific to each variable Vi can also be taken equal to the weighted average of the increases in the values of the weighting coefficients calculated for the durations of analyzes preceding and / or subsequent to a duration of current analysis. and thus verify the relation (5):
Figure imgf000020_0001
Figure imgf000020_0001
Dans cette relation on rappelle que AD désigne la durée totale des durées d'analyses élémentaires ADj prises en compte . Une description plus détaillée d'un système de détection d'un phénomène d'émergence d'information, à partir de données numériques échantillonnées support de cette information, conforme à l'objet de la présente invention sera maintenant donnée en liaison avec la figure 2a, dans le cadre non limitatif où un tel système est plus particulièrement destiné à la détection de phénomène d'émergence sur des pages HTML acquises par un utilisateur à partir d'un ou plusieurs sites WEB. Dans ces conditions, on comprend que le système, objet de la présente invention, est mis en œuvre, par un fournisseur d'accès au WEB, à partir d'une station de travail WS par exemple, laquelle peut comprendre, de manière classique, un écran d'affichage DU, une unité centrale de calcul CPU, une mémoire de travail RAM et une mémoire de masse notée HDD ainsi que les éléments périphériques classiques tels que clavier, souris ou autres par exemple. La station de travail WS est interconnectée au réseau INTERNET par les circuits classiques, tels qu'un modem par exemple, non représenté au dessin.In this relation, it is recalled that AD designates the total duration of the durations of elementary analyzes ADj taken into account. A more detailed description of a system for detecting a phenomenon of emergence of information, from sampled digital data supporting this information, in accordance with the object of the present invention will now be given in conjunction with FIG. 2a , in the nonlimiting context where such a system is more particularly intended for the detection of phenomenon of emergence on HTML pages acquired by a user from one or more WEB sites. Under these conditions, it is understood that the system, object of the present invention, is implemented, by a provider of access to the WEB, from a workstation WS for example, which can include, in a conventional manner, a display screen DU, a central computing unit CPU, a working memory RAM and a mass memory denoted HDD as well as the conventional peripheral elements such as keyboard, mouse or others for example. The WS workstation is interconnected to the INTERNET network by conventional circuits, such as a modem for example, not shown in the drawing.
Outre les éléments précités, le système, objet de l'invention, comporte au moins un module de mémorisation sur au moins une durée d'analyse AD, des données numériques sous forme de blocs de données numériques constitutives d'unités d'informations. On comprend en particulier que le module de mémorisation peut être constitué par l'unité de mémoire de masse HDD, laquelle permet, par l'intermédiaire de la mémoire RAM, de mémoriser les données numériques sous forme de pages HTML précitées . En outre, le système, objet de l'invention, comprend une base de données, notée DB, laquelle peut être installée sur la mémoire de masse HDD précitée, la base de données contenant bien entendu la pluralité de variables dites de référence, les variables Vi . Chaque variable est représentative d'un événement dont l'émergence est susceptible d'être mise en évidence dans au moins une unité d' information constituée par une page HTML par exemple . En outre, le système, objet de l'invention, comprend un module de détection dans une pluralité d'unités d'information de l'occurrence d'au moins une variable Vi et un module de calcul, pour chacune de ces variables précitées, d'un coefficient de pondération ou des valeurs de celui-ci Pik fonctions de cette durée d' analyse.In addition to the aforementioned elements, the system which is the subject of the invention comprises at least one storage module over at least one analysis time AD, digital data in the form of digital data blocks constituting information units. It is understood in particular that the storage module can be constituted by the mass memory unit HDD, which makes it possible, by means of the RAM memory, to store the digital data in the form of the aforementioned HTML pages. In addition, the system which is the subject of the invention comprises a database, denoted DB, which can be installed on the aforementioned HDD mass memory, the database naturally containing the plurality of so-called reference variables, the variables Vi. Each variable is representative of an event whose emergence is likely to be highlighted in at least one unit of information constituted by an HTML page for example. In addition, the system which is the subject of the invention comprises a module for detecting in a plurality of information units the occurrence of at least one variable Vi and a calculation module, for each of these aforementioned variables, of a weighting coefficient or of the values thereof Pik functions of this duration of analysis.
Ainsi que représenté de manière symbolique sur la figure 2a, le coefficient de pondération et chaque valeur de ce dernier sont associés à la variable Vi correspondante, selon la relation (1) précédemment mentionnée dans la description.As shown symbolically in FIG. 2a, the weighting coefficient and each value of the latter are associated with the corresponding variable Vi, according to the relation (1) previously mentioned in the description.
Un module de calcul est prévu pour calculer, sur la durée d'analyse ADj, l'accroissement des valeurs du coefficient de pondération associé à chaque variable selon la relation (2) précédemment mentionnée dans la description.A calculation module is provided for calculating, over the duration of analysis ADj, the increase in the values of the weighting coefficient associated with each variable according to the relation (2) previously mentioned in the description.
Enfin, un module comparateur de cet accroissement à la valeur de seuil déterminée Si associée à chaque variable Vi et spécifique à cette dernière est prévu afin de mettre en évidence le phénomène d'émergence de l'information correspondant à chaque variable Vi précitée. En ce qui concerne la mise en œuvre des différents modules énoncés précédemment, on indique que :Finally, a comparator module of this increase in the determined threshold value Si associated with each variable Vi and specific to the latter is provided in order to highlight the phenomenon of emergence of the information corresponding to each variable Vi mentioned above. Regarding the implementation of the various modules mentioned above, it is indicated that:
- le module de mémorisation des données numériques sous forme de bloc de données numériques peut être constitué par un programme d'application noté API, lequel est chargé en mémoire vive RAM pour exécution afin d'assurer la mémorisation pendant la durée de l'analyse des pages HTML acquises auprès de chaque site WEB accédé. Un tel programme d'application ne sera pas décrit en détail, car il correspond à des programmes d'application normalement disponibles dans le commerce ; le module de détection de l'occurrence d'au moins une variable Vi, le module de calcul pour chacune de ces variables d'un coefficient de pondération ou des valeurs Pik de ce dernier, fonctions de la durée d'analyse, le module de calcul sur cette durée d'analyse de l'accroissement des valeurs de coefficient de pondération et le module comparateur de cet accroissement à la valeur de seuil déterminé font l'objet d'un programme d'application spécifique, noté AP2 , lequel est également chargé en mémoire de travail RAM pour exécution et réalisation des fonctions selon les relations (2) à (5) précitées .the digital data storage module in the form of a digital data block can be constituted by an application program denoted API, which is loaded into random access memory RAM for execution in order to ensure storage for the duration of the analysis of the HTML pages acquired from each WEB site accessed. Such an application program will not be described in detail, since it corresponds to application programs normally available on the market; the module for detecting the occurrence of at least one variable Vi, the module for calculating for each of these variables a weighting coefficient or the Pik values of the latter, functions of the duration of analysis, the module of calculation over this analysis period of the increase in the weighting coefficient values and the comparator module of this increase to the determined threshold value are the subject of a specific application program, denoted AP2, which is also responsible in RAM working memory for execution and realization of functions according to relations (2) to (5) above.
En ce qui concerne le module de détection dans une pluralité d'unités d'information de l'occurrence d'au moins une variable Vi, on indique que ce module peut faire l'objet d'un sous-programme d'application AP21, lequel, suite au choix par le gestionnaire de la durée d'analyse ADj et des variables Vi affectées à l'utilisateur, permet d'effectuer une corrélation entre les variables dites de référence choisies par ce dernier, et les variables contenues dans chaque unité d'information, c'est-à-dire chaque page HTML par exemple . Un tel programme ne sera pas décrit en détail car il correspond à un simple programme de calculs de fonctions d'auto-corrélation par comparaison bit à bit entre chaque variable de référence et le contenu de l'information codée sous forme numérique dans chaque page HTML ou unité d'information.As regards the detection module in a plurality of information units of the occurrence of at least one variable Vi, it is indicated that this module can be the subject of an application subroutine AP21, which, following the choice by the manager of the duration of analysis ADj and of the variables Vi assigned to the user, allows a correlation to be made between the so-called reference variables chosen by the latter, and the variables contained in each unit of information, that is to say each HTML page for example. Such a program will not be described in detail since it corresponds to a simple program for calculating auto-correlation functions by bit-by-bit comparison between each reference variable and the content of the information coded in digital form in each HTML page. or information unit.
Toutefois, en ce qui concerne le choix des variables de référence, on indique que la station de travail WS peut être munie d'un système de menu déroulant ou de pages écrans, lesquelles permettent au gestionnaire, à partir de variables de référence Vi mémorisées sur la mémoire de masse du système, de choisir la ou les variables retenues pour l'utilisateur. Un tel menu est représenté de manière symbolique sur l'unité d'affichage DU de la station de travail WS sur la figure 2a. Les variables de référence Vi ainsi choisies sont mémorisées au niveau de la mémoire de masse HDD précédemment citée.However, with regard to the choice of reference variables, it is indicated that the WS workstation can be provided with a drop-down menu system or with screen pages, which allow the manager, from reference variables Vi stored on the mass memory of the system, to choose the variable or variables retained for the user. Such a menu is symbolically represented on the display unit DU of the work station WS in FIG. 2a. The reference variables Vi thus chosen are stored in the mass memory HDD previously cited.
A la suite de cette opération, le lancement du module de détection de l'occurrence des variables Vi permet de décompter le nombre d'occurrences de chaque variable Vi pendant la durée d'analyse ADj. Les coefficients de pondération et les valeurs de ces derniers sont alors calculés selon la relation (1) précédemment mentionnée dans la description.Following this operation, the launch of the module for detecting the occurrence of the variables Vi makes it possible to count the number of occurrences of each variable Vi during the analysis period ADj. The weighting coefficients and their values are then calculated according to the relation (1) previously mentioned in the description.
En ce qui concerne le module de calcul sur la durée d'analyse de l'accroissement des valeurs du coefficient de pondération associé à chaque variable Vi, on indique que ce module peut être intégré dans un sous- programme d'application AP22 permettant de détecter le phénomène d'émergence pour les variables Vi considérées selon la relation (2) et conformément au procédé, objet de la présente invention, tel que décrit en liaison notamment avec les figures le, ld et le.With regard to the module for calculating over the duration of analysis of the increase in the values of the weighting coefficient associated with each variable Vi, it is indicated that this module can be integrated into an application sub-program AP22 making it possible to detect the emergence phenomenon for the variables Vi considered according to relation (2) and in accordance with the method which is the subject of the present invention, as described in connection in particular with figures le, ld and le.
Le module de comparaison de l'accroissement précité à une valeur de seuil Si peut également être réalisé par un module comparateur sous routine intégrée au sous-programme AP22 précité.The module for comparing the above-mentioned increase to a threshold value Si can also be implemented by a comparator module under routine integrated into the aforementioned sub-program AP22.
Différents modes d'utilisation du système, objet de la présente invention, seront maintenant indiqués dans des applications spécifiques à la détection de phénomènes d'émergence d'information transitant sur le WEB par l'intermédiaire de données numériques échantillonnées support de cette information.Different modes of use of the system, object of the present invention, will now be indicated in specific applications for the detection of phenomena of emergence of information transiting on the WEB by means of sampled digital data supporting this information.
Les différentes utilisations seront décrites en liaison avec les figures 2c à 2e.The different uses will be described in conjunction with Figures 2c to 2e.
Dans le cadre des utilisations précitées, on indique que, de manière non limitative, l'unité d'information est constituée par une page HTML par exemple. Dans le cas de la figure 2c, le système, objet de la présente invention, peut être utilisé pour effectuer des opérations de pré-chargement, encore désignées pre- fetching.In the context of the aforementioned uses, it is indicated that, in a nonlimiting manner, the information unit is constituted by an HTML page for example. In the case of FIG. 2c, the system which is the subject of the present invention can be used to carry out pre-loading operations, also called pre-fetching.
Dans ces conditions, le système objet de l'invention, peut être couplé à un moteur de recherche, lequel comporte un opérateur recevant les adresses URL des pages HTML dans lesquelles un phénomène d'émergence est détecté. Dans ces conditions l'ensemble d'URL obtenu peut être transmis par l'intermédiaire du réseau INTERNET vers une mémoire cache d'un portail d'accès du WEB par exemple, ainsi que représenté en figure 2c. Les opérations mises en œuvre par l'intermédiaire du moteur de recherche sont commandées par un programme d'application noté APx sur la figure 2a et sur la figure 2c. Dans une telle application, le programme d'application APx est directement appelé en mémoire de travail RAM par l'unité centrale du système objet de l'invention qui permet d'assurer les fonctions précédemment mentionnées en liaison avec la figure 2c. Dans cette utilisation, on comprend que les variables pour lesquelles le phénomène d'émergence a été mis en évidence, conformément au procédé objet de la présente invention, et grâce à la mise en œuvre du système, objet de l'invention, sont alors utilisées pour récupérer les URL précitées grâce au moteur de recherche . Les pages HTML correspondant à ces URL étant mémorisées dans la mémoire cache du portail d'accès au WEB précédemment mentionné.Under these conditions, the system which is the subject of the invention can be coupled to a search engine, which comprises an operator receiving the URL addresses of the HTML pages in which an emergence phenomenon is detected. Under these conditions the set of URLs obtained can be transmitted via the INTERNET network to a cache memory of a WEB access portal for example, as shown in FIG. 2c. The operations implemented via the search engine are controlled by an application program denoted APx in FIG. 2a and in FIG. 2c. In such an application, the application program APx is directly called in working memory RAM by the central unit of the system which is the subject of the invention which makes it possible to perform the functions mentioned above in connection with FIG. 2c. In this use, it is understood that the variables for which the phenomenon of emergence has been highlighted, in accordance with the method which is the subject of the present invention, and thanks to the implementation of the system, which is the subject of the invention, are then used to retrieve the aforementioned URLs using the search engine. The HTML pages corresponding to these URLs are stored in the cache memory of the WEB access portal previously mentioned.
En référence à la figure 2d, le procédé et le système objets de la présente invention peuvent également être utilisés afin d'assurer une diffusion ciblée. Dans ces conditions, les variables Vi pour lesquelles le phénomène d'émergence a été mis en évidence grâce au procédé et au système, objets de la présente invention, sont alors mémorisées et utilisées par exemple par un diffuseur d'information pour cibler les programmes diffusés par exemple.With reference to FIG. 2d, the method and the system which are the subject of the present invention can also be used in order to ensure targeted diffusion. Under these conditions, the variables Vi for which the phenomenon of emergence has been highlighted by means of the method and the system, objects of the present invention, are then stored and used for example by an information distributor to target the programs broadcast. for example.
Enfin, dans le cas de la figure 2e, le procédé et le système, objets de la présente invention, peuvent être utilisés afin de procéder à des recommandations diffusées de manière générale sur le réseau INTERNET par exemple. Dans ces conditions, le procédé et le système, objets de la présente invention, sont utilisés pour, à partir des variables pour lesquelles le phénomène d'émergence a été mis en évidence et d'un mécanisme de recommandations permettant, à partir des variables précitées, de choisir par exemple des URL ou des pages HTML, transmettre les suggestions ou recommandations précitées par l'intermédiaire du réseau INTERNET de manière générale ou spécifique aux utilisateurs. Finally, in the case of FIG. 2e, the method and the system, objects of the present invention, can be used in order to proceed to recommendations broadcast generally on the INTERNET network for example. Under these conditions, the method and the system, objects of the present invention, are used for, from variables for which the phenomenon of emergence has been highlighted and a mechanism of recommendations making it possible, from the aforementioned variables, to choose for example URLs or HTML pages, to transmit the aforementioned suggestions or recommendations through the INTERNET network in general or specific to users.

Claims

REVENDICATIONS
1. Procédé de détection d'un phénomène d'émergence d'information à partir de données numériques échantillonnées, support de cette information, caractérisé en ce que ce procédé consiste, pour une pluralité de variables support de cette information : à définir une durée d'analyse de mise en évidence dudit phénomène d ' émergence ,- à calculer sur ladite durée d'analyse, pour chacune desdites variables, un coefficient de pondération fonction de cette durée, une ou plusieurs valeurs de ce coefficient de pondération étant associée (s) à chaque variable considérée ; - à calculer sur ladite durée d'analyse l'accroissement des valeurs du coefficient de pondération associées à chaque variable ; à comparer ledit accroissement à une valeur de seuil déterminée, spécifique à chaque variable, ledit phénomène d'émergence d'information étant détecté pour toute variable dont l'accroissement des valeur du coefficient de pondération est supérieur à ladite valeur de seuil déterminée spécifique.1. Method for detecting a phenomenon of emergence of information from sampled digital data, support for this information, characterized in that this process consists, for a plurality of variables supporting this information: in defining a duration d analysis to highlight said emergence phenomenon, - to calculate over said duration of analysis, for each of said variables, a weighting coefficient as a function of this duration, one or more values of this weighting coefficient being associated (s) to each variable considered; - calculating over said analysis time the increase in the values of the weighting coefficient associated with each variable; comparing said increase to a determined threshold value, specific to each variable, said information emergence phenomenon being detected for any variable whose increase in the weighting coefficient value is greater than said specific determined threshold value.
2. Procédé selon la revendication 1, caractérisé en ce que ladite durée d'analyse est une valeur temporelle.2. Method according to claim 1, characterized in that said analysis duration is a time value.
3. Procédé selon la revendication 1, caractérisé en ce que ladite durée d'analyse est un nombre d'occurrence d'événements générateur de cette information.3. Method according to claim 1, characterized in that said analysis duration is a number of occurrence of events generating this information.
4. Procédé selon l'une des revendications 1 à 3, caractérisé en ce que lesdites variables sont choisies parmi des types de variables distincts tels que variables thématiques, variables comportementales, variables de contexte, lesdites variables de chaque type de variable et leurs coefficients de pondération associés étant constitués en vecteurs d'analyse. 4. Method according to one of claims 1 to 3, characterized in that said variables are chosen from distinct types of variables such as variables thematic, behavioral variables, context variables, said variables of each type of variable and their associated weighting coefficients being constituted as analysis vectors.
5. Procédé selon l'une des revendications 1 à 4, caractérisé en ce que, pour une analyse périodique de ladite pluralité de variables support de cette information, cette analyse étant conduite sur une pluralité de durées d'analyse successives, ladite valeur de seuil spécifique à chaque variable est prise égale à la moyenne des accroissements des valeurs des coefficients de pondération calculée pour les durées d'analyse antérieures et/ou postérieures à une durée d'analyse courante.5. Method according to one of claims 1 to 4, characterized in that, for a periodic analysis of said plurality of variables supporting this information, this analysis being carried out over a plurality of successive analysis durations, said threshold value specific to each variable is taken equal to the average of the increases in the weights of the coefficients calculated for the analysis durations before and / or after a current analysis duration.
6. Système de détection d'un phénomène d'émergence d'information à partir de données numériques échantillonnées support de cette information, caractérisé en ce que ce système comporte au moins : des moyens de mémorisation, sur au moins une durée d'analyse, desdites données numériques sous forme de blocs de données numériques, constitutifs d'unités d'information ; des moyens de bases de données contenant une pluralité de variables de référence, chaque variable étant représentative d'un événement susceptible d'être mis en évidence dans au moins une unité d'information ;6. System for detecting a phenomenon of emergence of information from sampled digital data supporting this information, characterized in that this system comprises at least: storage means, over at least one duration of analysis, said digital data in the form of digital data blocks, constituting information units; database means containing a plurality of reference variables, each variable being representative of an event capable of being highlighted in at least one information unit;
- des moyens de détection dans une pluralité d'unités d'information de l'occurrence d'au moins une variable ; des moyens de calcul pour chacune de ces variables d'un coefficient de pondération fonction de cette durée d'analyse, ledit coefficient de pondération étant associé à ladite variable et mémorisé dans ladite base de données ;means of detection in a plurality of information units of the occurrence of at least one variable; means for calculating a weighting coefficient for each of these variables as a function of this duration of analysis, said weighting coefficient being associated with said variable and stored in said database;
- des moyens de calcul, sur cette durée d'analyse, de l'accroissement des valeurs du coefficient de pondération associées à chaque variable ; des moyens comparateurs de cet accroissement à une valeur de seuil déterminée, spécifique à chaque variable, ledit phénomène d'émergence d'information étant détecté pour toute variable dont 1 ' accroissement des valeurs du coefficient de pondération est supérieur à ladite valeur de seuil déterminée spécifique.- means for calculating, over this analysis period, the increase in the values of the weighting coefficient associated with each variable; means for comparing this increase to a determined threshold value, specific to each variable, said phenomenon of emergence of information being detected for any variable whose increase in the weighting coefficient values is greater than said specific determined threshold value .
7. Système selon la revendication 6, caractérisé en ce que celui-ci comporte en outre une interface homme/machine comprenant : - des moyens de sélection de ladite durée d'analyse ;7. System according to claim 6, characterized in that it further comprises a man / machine interface comprising: - means for selecting said analysis time;
- des moyens de sélection dans ladite pluralité de variables de référence d'un ensemble de variables support de cette information.means for selecting from said plurality of reference variables a set of variables supporting this information.
8. Système selon l'une des revendications 6 ou 7, caractérisé en ce que lesdits moyens de détection dans une pluralité d'unités d'information de l'occurrence d'une variable comprennent : . des moyens de lecture de ladite information ; des moyens de comparaison bit à bit de 1 ' information lue et des variables support de cette information, ce qui permet d'établir le nombre d'occurrences desdites variables dans chaque unité d'information.8. System according to one of claims 6 or 7, characterized in that said means of detection in a plurality of information units of the occurrence of a variable comprise:. means for reading said information; means for bit by bit comparison of the information read and of the variables supporting this information, which makes it possible to establish the number of occurrences of said variables in each unit of information.
9. Système selon l'une des revendications 6 à 8, caractérisé en ce que ladite unité d'information étant constituée par une page HTML, lesdits moyens de mémorisation sur une durée d'analyse desdites données numériques sont constituées par un moteur de recherche, ledit système comportant un opérateur recevant les adresses URL des pages HTML dans lesquelles un phénomène d'émergence est détecté et permettant la transmission de ces adresses HTML vers une mémoire cache d'un portail d' accès du WEB.9. System according to one of claims 6 to 8, characterized in that said information unit being constituted by an HTML page, said means of storage over a period of analysis of said data Numerical are constituted by a search engine, said system comprising an operator receiving the URL addresses of HTML pages in which an emergence phenomenon is detected and allowing the transmission of these HTML addresses to a cache memory of an access portal of the WEB.
10. Utilisation du procédé et du système selon l'une des revendications 1 à 9, pour le pré-chargement de la mémoire cache d'un portail d'accès du WEB. 10. Use of the method and the system according to one of claims 1 to 9, for the preloading of the cache memory of a WEB access portal.
11. Utilisation du procédé et du système selon l'une des revendications 1 à 9, pour la diffusion ciblée.11. Use of the method and system according to one of claims 1 to 9, for targeted dissemination.
12. Utilisation du procédé et du système selon l'une des revendications 1 à 9, par l'intermédiaire d'un mécanisme de recommandations pour la diffusion de suggestions à des utilisateurs. 12. Use of the method and the system according to one of claims 1 to 9, by means of a recommendation mechanism for the dissemination of suggestions to users.
PCT/FR2002/002095 2001-06-22 2002-06-18 Method and system for detecting an emergence of information phenomenon from sampled digital data WO2003001419A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0108267A FR2826478A1 (en) 2001-06-22 2001-06-22 METHOD AND SYSTEM FOR DETECTING AN INFORMATION EMERGENCE PHENOMENON FROM SAMPLE DIGITAL DATA
FR0108267 2001-06-22

Publications (1)

Publication Number Publication Date
WO2003001419A1 true WO2003001419A1 (en) 2003-01-03

Family

ID=8864664

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2002/002095 WO2003001419A1 (en) 2001-06-22 2002-06-18 Method and system for detecting an emergence of information phenomenon from sampled digital data

Country Status (2)

Country Link
FR (1) FR2826478A1 (en)
WO (1) WO2003001419A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110379370A (en) * 2019-07-19 2019-10-25 合肥工业大学 A kind of RGB-Delta type display panel sub-pixel rendering method based on threshold value comparison

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
G.L. SOMLO & A. E. HOWE: "Incremental clustering for profile maintenance in information gathering web agents", PROCEEDINGS OF THE 5TH INTERNATIONAL CONFERENCE ON AUTONOMOUS AGENTS, - May 2001 (2001-05-01), Montreal, Quebec, Canada, pages 262 - 269, XP002197051 *
M. SHEWHART & M. WASSON: "Monitoring a newsfeed for hot topics", PROCEEDINGS OF THE 5TH ACM SIGKDD INTERNATIONAL CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MINING, - 1999, San Diego, California, USA, pages 402 - 404, XP002197049 *
YOUNG-WOO SEO AND BYOUNG-TAK ZHANG: "Learning user's preferences by analyzing web-browsing behaviors", PROCEEDINGS OF THE 4TH INTERNATIONAL CONFERENCE ON AUTONOMOUS AGENTS, ACM PRESS PUBLISHERS., 2000, Barcelona, Spain, pages 381 - 387, XP002197048 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110379370A (en) * 2019-07-19 2019-10-25 合肥工业大学 A kind of RGB-Delta type display panel sub-pixel rendering method based on threshold value comparison
CN110379370B (en) * 2019-07-19 2020-10-23 合肥工业大学 RGB-Delta type display panel sub-pixel rendering method based on threshold comparison

Also Published As

Publication number Publication date
FR2826478A1 (en) 2002-12-27

Similar Documents

Publication Publication Date Title
US9947025B2 (en) Method and apparatus for providing search capability and targeted advertising for audio, image, and video content over the internet
US20170235730A1 (en) System and method for providing sequentially relevant content
US8291075B1 (en) Detecting events of interest
US7966395B1 (en) System and method for indicating interest of online content
US20210201094A1 (en) Methods and apparatus for identifying objects depicted in a video using extracted video frames in combination with a reverse image search engine
CN101025737A (en) Attention degree based same source information search engine aggregation display method and its related system
US20090204581A1 (en) Method and apparatus for information processing based on context, and computer readable medium thereof
EP1367745B1 (en) Process for autoadaptive administration of the relevance of multimedia contents for a receiver of these contents and associated receiver
FR3043816A1 (en) METHOD FOR SUGGESTION OF CONTENT EXTRACTED FROM A SET OF INFORMATION SOURCES
CN104899306A (en) Information processing method, information display method and information display device
FR2929411A1 (en) METHOD AND SYSTEM FOR TRACKING AND TRACKING TRANSMITTERS.
US20150294331A1 (en) Peer-to-peer data collector and analyzer
WO2003001419A1 (en) Method and system for detecting an emergence of information phenomenon from sampled digital data
US20080086476A1 (en) Method for providing news syndication discovery and competitive awareness
CN111523027B (en) Automatic data news writing robot based on blockchain technology
KR20150058868A (en) Method for web browsing on offline based HTML5
Wang et al. Adaptive identification of hashtags for real-time event data collection
KR101267847B1 (en) System for searching Multimedia Data having Searching Engine being base on web and Content Searching Engine being based on content and the method thereof
CN113453076A (en) User video service quality evaluation method and device, computing equipment and storage medium
EP2245555A1 (en) Method of identifying a multimedia document in a reference base, corresponding computer program and identification device
FR2853788A1 (en) METHOD AND DEVICE FOR ACCESSING A DIGITAL DOCUMENT IN A PEER-TO-PEER COMMUNICATION NETWORK
FR2902907A1 (en) Digital information e.g. text data, searching method for e.g. Internet, involves transmitting collecting instructions to satellite module, and processing information, collected from satellite module, by processing module
FR2855695A1 (en) Multimedia programs radio broadcasting method for e.g. PDA, involves adding header to multimedia programs before broadcasting each program, where header indicates type of client device for which program is destined
EP3502905B1 (en) Method for pre-loading data
FR3138222A1 (en) DATA COLLECTION SYSTEM ARCHITECTURE

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NO NZ OM PH PL PT RO RU SD SE SG SI SK SL TJ TM TN TR TT TZ UA UG US UZ VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG US

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

122 Ep: pct application non-entry in european phase
ENP Entry into the national phase

Ref document number: 2005101339

Country of ref document: RU

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: JP

WWW Wipo information: withdrawn in national office

Country of ref document: JP