EP3494494A1 - Moyens de diffusion d'un contenu personnalisé dans un réseau de communication - Google Patents

Moyens de diffusion d'un contenu personnalisé dans un réseau de communication

Info

Publication number
EP3494494A1
EP3494494A1 EP17757809.3A EP17757809A EP3494494A1 EP 3494494 A1 EP3494494 A1 EP 3494494A1 EP 17757809 A EP17757809 A EP 17757809A EP 3494494 A1 EP3494494 A1 EP 3494494A1
Authority
EP
European Patent Office
Prior art keywords
user
content
module
interest
session
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP17757809.3A
Other languages
German (de)
English (en)
Inventor
Eric Mathieu
Cyril MARCH
Bruno PRELY
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qwant SAS
Original Assignee
Qwant SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qwant SAS filed Critical Qwant SAS
Publication of EP3494494A1 publication Critical patent/EP3494494A1/fr
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history

Definitions

  • the present invention relates to the field of broadcasting, in an information system, of personalized information in an automated manner.
  • the invention relates more particularly to means for implementing, in a communication network, spaces for distributing personalized information to a user, according to the interests of said user.
  • the information dissemination spaces can be in particular advertising spaces, or spaces reserved for recommended content, intended to be displayed, or in a page of a website accessed by the user, during a session open by means of a web browser software, either within an application embedded on a mobile device (mobile phone, also called Smartphone according to the Anglo-Saxon term, or tablet) during its consultation.
  • a first approach adapted to websites with a search engine, may consist of displaying personalized content, based for example on keywords entered by the user and used to explain a search query. If this first approach can be effective, the content customization is insufficient for the precise and real-time understanding of the interest, the commitment of the user (that is to say, his receptivity vis-à-vis a content), and its own intentions.
  • Cookies more commonly referred to by the English term "cookies”, managed by the web browser, or by connecting to an application on a mobile device with the user's name and password (for example when downloading), are typically used for this purpose. In the case of the dissemination of advertising, the cookies thus make it possible to uniquely identify the user as a consumer and to offer him an advertising message on the current site.
  • Advertising targeting is then based on the individual recognition of the user associated with its history of previous consultations, and allows to target the user based on past interests, hence the term “retargeting" The user is already known to the advertiser.
  • the customization methods used by existing profiling systems require uniquely identifying the user, and the customization of the content relies on the recording of a data history specific to that user.
  • the recorded data is collected from the same site - for example an e-commerce site - or from several sites, grouped together in the same network of purchase of advertising space, or recommendations from content.
  • the same identification and profiling service of the user is typically used to store the profile of the user, including for example information relating to his interests (previous sites and pages consulted, previous searches made with keywords) and its behavior during previous visits to one or more websites.
  • the aim of the invention is to provide means for implementing, in a communication network, spaces for the distribution of personalized information to a user, according to the current interest of the user, and therefore specific to its current consultation, and not to its past navigation, or even to other sites.
  • the information dissemination spaces may be in particular advertising spaces, intended to be displayed on a page of a website accessed by the user, during an open session using a web browser, or within an application on mobile equipment.
  • the invention also aims to propose technical means adapted to the implementation of an advertising space selling infrastructure, based on the iterative refinement of the user's interest center from data extracted from the content of the website accessed during the current session of the user, and regardless of the user's past browsing history on that same website or other websites.
  • the invention also aims to take into account the commitment of the user with the content presented during a session, taking into account the user's interactions, and the way the content is consumed.
  • the invention also aims to allow the characterization of the behavior of a user, anonymously, vis-à-vis a subject in terms of the degree of commitment that is to say the receptivity of the subject.
  • the invention also aims to allow the characterization of the behavior of a user vis-à-vis a subject, and anonymously, in terms of the intention of the user, so as to allow the determination of a likelihood that the user will interact with an advertisement, and, if necessary, redirect the user to another site from which a purchase could be made.
  • the invention also aims at proposing technical means for an advertising space selling infrastructure based on iterative refining, these means being able to enable characterization and improvement in precision of the interest center by iterative refining, in a function of the entire path in the consulted content, namely browsing the pages, the actions on the content, the various searches by menus and filters or by keywords, the content selections in positive and / or in negative , and more generally all the successive actions and requests made for current research, including their concatenations and their variations within the iterative cycle of research.
  • the invention is therefore not limited to the expression of the last action or query of the search in the content.
  • One or more of these objects are fulfilled by the broadcast method, the computer program, the medium, the module, and the system objects of the independent claims.
  • the dependent claims further provide solutions to these objects and / or other advantages.
  • center of interest one refers to what characterizes and synthesizes the "context", namely the content itself of the pages viewed, the metadata of the pages, which may not be displayed, but also the progress of the session, such as the sequence of interactions, the navigation path, any selection of content, and more generally the content itself as well as all the actions to obtain the content displayed in the course of the session.
  • the focus includes, among other things, content selection actions such as:
  • Content search actions that can use keywords, or any other actions on content: I like / I do not like, ... and can also contribute to the search for content by a textual search engine and multimedia.
  • the term "user commitment” refers to the user's receptivity to the content, which can be measured by the way the content is viewed and the user's interactivity with the user. content.
  • the commitment is essentially of a behavioral nature, of which here are some examples for illustration:
  • engagement variable in a number of aspects, reference is made to user engagement information, such as, for example, a percentage of the displayed portion of an article. , a display time of the article, a video playback percentage, a number of clicks during the session, etc., as well as any combinations of variables that can be calculated (for example on a scale of 0 to 10), and which can also make it possible to determine more global parameters, such as:
  • degree of intent refers to the likelihood of clicking links to other content or advertisements presented.
  • the invention relates to a method for broadcasting a personalized content, in a communication network, to a navigation module, during a session established between the navigation module and a content server module, said current session.
  • the content server module may be a website, or a data source adapted for use by the navigation module.
  • the navigation module can be in particular a web browser, or an application adapted to be executed by a terminal and configured to use data provided by the content server module.
  • the method comprises the following steps:
  • the personalized content for the user can be determined and / or selected by a content delivery module, according to the characterization of the context and the characterization of said at least one measurement of the center. of interest, and said at least one measure of the degree of commitment determined during the fourth step.
  • the content delivery module may belong to the system according to the fifth aspect, or be managed by a third party.
  • the collection of information relating to at least one interaction of a user can be reduced to the collection of basic information, for example the collection of a single keyword, during a first search for content.
  • said at least one content page may be a web page transmitted to the navigation module during the session.
  • the invention makes it possible to take into account information going beyond a first characterization of the center of interest obtained as a result of the user entering one or more initial keywords or a semantic summary. one page.
  • the invention makes it possible to take into account several successive pages of content or several iterations of searches based on keywords, and any preferences, in positive or negative, expressed by the user on content presented successively.
  • the invention therefore makes it possible to take into account the progression of the search undertaken by the user, in particular the information entered or selected, but also the information consulted during a succession of search queries having generated multiple lists of results. . It is then possible to optimally characterize the interest of the user, which is not reduced just to the consideration of the last request, or interaction of the user, and therefore provide content relevant custom related to the entire current session of the user and until his last query or interaction included.
  • the steps of the method according to the invention may also be repeated, for example periodically or on detection of a particular event, such as a new interaction of the user with the navigation module.
  • the navigation module can be implemented from a personal computer, or from an application on mobile equipment.
  • the first step may be executed periodically, or after detecting a new interaction of the user on a content page transmitted by the content server module.
  • the personalized content offered to the navigation module it is possible to determine and improve with each new interaction from the user, the personalized content offered to the navigation module.
  • the method of broadcasting personalized content according to the first aspect is adapted in particular to be implemented by a system for selling advertising space by refining.
  • the method according to the first aspect thus makes it possible to refine, by iteration, on the one hand, the current interest of the user, in terms of current focus, and, on the other hand, the extent of his commitment. with respect to the content presented, in relation to its current focus, and / or the prediction of the degree of commitment, such as the potential purchase intent (in the case of commercial products or services).
  • the method By collecting on one and the same website, or on the a content server supplying the application, the content of the pages viewed, the keywords as well as the interaction data or any other means for searching and accessing new information, and only for the current consultation session and / or search of the user, the method makes it possible not to use the user's own browsing history on the Internet, and does not require, in particular, the use of cookies for the identification of the user. user and access to his history.
  • the method according to the first aspect makes it possible to analyze the current activity of the user, that is to say his activity during the current session, and to deduce the signature of the current session, in the compared to multiple previously profiled and anonymized sessions, compared to the activity of previous users who accessed the same types of information on the same website and had similar behaviors and contexts.
  • the activity of the user can be characterized and refined iteratively by the information on the observed context - which can be keywords in the case of a search engine used to obtain the information visualized - by the center.
  • real interest of the user obtained by deducting the current navigation of the user on the site currently browsed, and the level of interest of the user for the subjects of the pages viewed.
  • the level of interest of the user for a subject is determined in particular by the way he interacts with the information of the site, by the way he searches for information (by links, by keywords, the sequence of interactions , etc.) and the different formats of content viewed (text pages, images, and videos, and their combinations).
  • This level of interest can be compared with similar experiences from other users, and can be characterized by the degree of interest in the content or degree of intention in the potential purchase sense, when it comes to marketable products or services.
  • Said at least one interaction of the user with said at least one content page may relate to one or a combination of interactions from the following list, but not limiting: consultation of a page of content / web, consultation of a subsection of a page of content / web via a link or a menu, entry of a keyword, expression of an interest or a non-interest for a multimedia document, action and / or input of the user to perform content search, navigation action and / or user input to access new information within the content server, or the website.
  • said at least one context variable can be determined, depending on the content of said at least one page of content or web page transmitted to the navigation module during the session and / or non-current information. visible to the user attached to said content, such as metadata.
  • said at least one context variable can be determined, if necessary, according to a selection and / or a combination, at the input, of criteria, and / or of actions and / or objects used by the user to formulate, by means of the navigation module, a search request for personalized content, intended for a search module associated with the content server module.
  • the criteria considered may be based on the terms used by the user, either directly or indirectly, for example in the case of metadata associated with selected documents.
  • the said at least one context variable can be determined, according to a selection and / or a combination, at the input, of at least one textual information and / or at least one object multimedia, for formulating the request for personalized content, for the search module associated with the content server module.
  • the request can in particular be from a search engine.
  • Said at least multimedia object may in particular be a multimedia object without limitation on the type of computer format of the object, for example a video, an image, a sound file, a pdf file, an E-Commerce product sheet ...
  • the at least one multimedia object can be selected by the user, directly or indirectly.
  • the request can be built by successive iterations so as to refine the personalized content during the same session.
  • the request can be constructed by iteration of user selections of multimedia objects and / or textual entries, and by proposals, combinations and successive refinements of the results by the search engine.
  • the search module associated with the content server module may be implemented by the means described in the document WO 2014/191703.
  • said at least one context variable can be determined, depending on the content of said at least one content page transmitted to the navigation module, or keywords collected during the first step, and according to at least one reference ontology relating to a plurality of concepts.
  • the plurality of concepts of the reference ontology for example relates to the subjects consulted in the field, or that may be relevant as advertising targeting advertising segments.
  • said at least one user commitment variable with said at least one content page transmitted by the internet content server module can be determined according to information relating to said at least one interaction of the Internet content server module. a user collected during the first step.
  • the historical data set of previous sessions comprises, for example, anonymous data collected during user sessions established between third-party navigation modules and the content server module.
  • User sessions may in particular correspond to sessions of users having previously accessed the content on the content server module, without necessarily having been identified.
  • the characterization of the context may in particular be carried out in order to develop said at least one point of interest of the user. Also, during the fourth step, the characterization of the context can be determined:
  • the proximity of the current session can be calculated according to a distance function between sessions according to automatic learning techniques.
  • This classification model can be constrained, for example to reflect a marketing micro-segmentation, using machine learning techniques or machine learning in order to correspond to a reference ontology of the domain. about the accessed, or an ontology suitable for an advertising targeting use, to define the marketing segment.
  • the iterative browsing of the content by the user but also during a search of content by an iterative search engine, makes it possible to implement reinforcement learning techniques. allowing automatic learning.
  • This machine learning is to learn from the historized sessions and to propose, for any new session, customized content or targeted advertising in an optimized way according to predefined engagement criteria, such as, but not limited to , a click rate on the content, or a click rate on advertising.
  • the custom content can be:
  • the selection from a set of contents can be made by a module of a website, on the content server, or by a module hosted on a third party server responsible for providing personalized content, or so-called contextual advertisements.
  • the invention relates to a computer program comprising instructions for performing the steps of the method according to the first aspect, when said program is executed by a processor.
  • Each of these programs can use any programming language, and be in the form of source code, object code, or intermediate code between source code and object code, for example in a partially compiled form, or in any form what other form is desirable.
  • the invention relates to a computer-readable recording medium on which is recorded a computer program comprising instructions for executing the steps of the method according to the first aspect.
  • the information carrier may be any entity or any device capable of storing the program.
  • the medium may comprise storage means, such as a ROM, for example a CD-ROM or a microelectronic circuit ROM, or a magnetic recording means, for example a diskette or a hard disk.
  • the information medium may be a transmissible medium such as an electrical or optical signal, which may be conveyed by an electrical or optical cable, by radio or by other means.
  • the program according to the invention can be in particular downloaded on an Internet or Intranet network.
  • the information carrier may be an integrated circuit in which the program is incorporated, the circuit being adapted to execute or to be used in the execution of the method in question.
  • the invention relates to a module adapted to broadcast personalized content, in a communication network, to a navigation module, during a session established between the navigation module and a content server module.
  • the module includes:
  • a module configured to collect information relating to at least one interaction of a user, by means of the navigation module, with at least one page of content developed at least partially from data transmitted by the content server module;
  • a module configured to determine at least one context variable relating to at least one center of interest of the user, as a function of the information relating to said at least one user interaction;
  • a module configured to determine at least one commitment variable of the user with said at least one content page, based on the information relating to said at least one interaction of a user;
  • a module configured to determine, based on a historical set of anonymized previous session data: o a characterization of the context according to said at least one context variable relating to at least one center of interest of the user;
  • a module configured to broadcast, to the navigation module, personalized content according to the characterization of the context and the characterization of said at least one measure of the degree of commitment or said at least one measure of the degree of interest.
  • the invention relates to a system comprising a navigation module, a content server module and a module according to the fourth aspect.
  • FIG. 1 is a schematic representation of a system for implementing personalized information dissemination spaces intended for a user, according to one embodiment of the invention
  • FIG. 2 is a block diagram of the steps of a method for predicting the behavior of the user, according to one embodiment of the invention
  • FIG. 3 is a diagram, according to one embodiment, of a navigation module according to the invention.
  • a session refers to the period during which a user produces a series of queries using his browser software during a visit to a website, or from time to time. an application on mobile equipment accessing the content server.
  • a session refers to a delimited period during which the same content server communicates and performs operations for the benefit of a user, connected by means of a module computer running content access software.
  • a session management mechanism for example using, among other means, the session management mechanism associated with the user interface, may be used to determine for each new interaction of the session.
  • the start of a new session the continuity of a session already started, and / or the end of the session, for the same internet browser on the same terminal, for the same application on the equipment mobile, based on computer criteria, such as the creation of a new session by the browser, or time criterion, following the expiration of the session on the basis of a time counter of inactivity.
  • computer criteria such as the creation of a new session by the browser, or time criterion, following the expiration of the session on the basis of a time counter of inactivity.
  • the preceding criteria can be supplemented or combined with a thematic consistency criterion developed from the context, and based on the semantic proximity of the content consulted according to a reference ontology, within a session management module allowing force the end of the current session, in the case of too much divergence of subjects, and thus trigger the start of a new session.
  • the system may be an advertising space implementation system with iterative characterization and refinement of a user's intent in terms of focus and engagement.
  • the system is configured to collect and use, for this purpose, information relating to contextual and behavioral data collected during interactions of the user with the pages of a website, or with an application residing on mobile equipment.
  • This user-specific information is typically obtained during the same browsing or search activity, possibly using a search engine, on the site currently browsed by the user.
  • the collection of this information is limited in time, for example during a single session, most often characterized by a limited duration, and the same focus of interest on the part of the user.
  • the system comprises a navigation module 110 adapted to be in particular a browser software, or an application on a mobile device, such as a smartphone or tablet.
  • the navigation software allows a user of the navigation module 110 to access the pages of a website or a website. content server, and to consult and / or interact with said pages or content.
  • the navigation module 110 may in particular be embedded in a computer, in a mobile communication terminal, in a connected system, etc.
  • the system comprises a content server module 120, coupled to the Internet and hosted by or on behalf of a content editor, adapted to store, generate and transmit web pages or content, to the navigation module 110, upon request of this last.
  • the web server module 120 is coupled to a session profiling module 130.
  • the session profiling module 130 uses one or more artificial intelligence, clustering, reinforcement learning techniques to determine the signature. of the current session, and recalculate it with each new iteration, taking into account the history of the entire session. The signature of the recalculated session during the last iteration is compared and classified against previous anonymized sessions of users. Classification profiling allows for the development of at least one point of interest, and at least one measure of the degree of commitment.
  • the session profiling module 130 then transmits to the custom content server editor module 140 the focus of the session that can be the label, namely the name of the session cluster in which the session was assigned, and increased by additional attributes that may specify a finer classification.
  • the session profiling module 130 determines the commitment level and delivers one or more parameters qualifying the user's commitment, namely the degree of interest or intention with respect to the content presented.
  • the system includes a custom content server editor module 140, coupled to the session profiling module 130 and a content delivery module 150, which can also be operated by a third party. Said at least one point of interest and at least one degree of commitment are provided by the custom content server editor module 140 by an API to the content delivery module 150 which determines the content most suited to the content of the content. user according to the elements provided to him and an internal logic of decision.
  • the content delivery module 150 may in particular be a suitable system for advertising sales, or recommendation of publisher content, for making available content provided by a plurality of advertisers, or third-party publishers, in from source data 162, 164.
  • the personalized content is determined by the content delivery module 150 outside the environment of the user without a connection indicator retrieved within the navigation module 110 (for example of the type cookie, tag, ...) and without direct interaction with this environment.
  • the identity information (or any other means of user recognition) is not used in the determination of the personalized content, since only the information from the anonymized session provided by the server editor module custom contents 140, are used for decision making of the content delivery module 150.
  • the system includes a custom content server module 170, coupled to the content delivery module 150, which will implement the personalized content interacting with the navigation module 110.
  • the personalized content server 170 is also coupled to a tracking module of the display of the personalized information 190, as displayed on the navigation module 110, and interacting with the content server module 120 and / or the navigation module. 110, to measure the display of personalized content, thereby guaranteeing the proper performance of a display contract, it may be of commercial type with third parties.
  • the system may include a content distribution network 180, coupled to the navigation module 110 and the custom content server advertiser module 170, to optimize its efficiency in terms of response time and display.
  • FIG. 3 represents a detailed embodiment of the navigation module 110.
  • the navigation module 110 comprises a user interface 310, typically a screen, and means of interaction with a user such as a keyboard, a touch surface, sensors, etc.
  • the user interface is particularly adapted to display contents transmitted by a content server module 120.
  • the navigation module 110 comprises a collection module 320 of session data items.
  • the collection module 320 is configured to obtain, by means of the navigation module 110, information relating to the interactions of the user with the content presented, including for example web pages, provided by the content server module 120.
  • the information collected (logged in the Anglo-Saxon word) by the collection module 320 are for example related to the content pages viewed, keywords entered by the user, actions and / or inputs of the user to search and / or navigate to access new information within the same site - using links filters, all kinds of searches, for example by image, etc.
  • the navigation module 110 comprises an iterative classification module 330, operating in real time, coupled to storage means 340 for the current session and to a session history database 350.
  • the iterative classification module 330 is notably configured to calculate the context variables of the current session, namely at least one interest-point variable and at least one commitment variable, for storing in the storage means the information collected by the collection module 320, and to provide the necessary information to the content delivery module 150.
  • the session history database 350 is coupled to a session profiler module 360 for classifying the historical session database 350, by constructing at least one interest-point variable, and at least one an engagement variable for each stored session.
  • the iterative classification module 330 is configured to transmit to the content delivery module 150 at least one context information qualified by a user's center of interest, determined according to:
  • the session history database 350 coupled to a session profiler module 360, stores a historical set of data from previous sessions, said session data typically being previously obtained. from a plurality of anonymous data collected during sessions, on the same website for many users.
  • the session profiler module 360 is further configured to allow a signature for each session of the historical data set of previous sessions to be determined by constructing at least one interest-point variable and at least one a commitment variable, to thereby classify the sessions by degree of similarity (so-called "Clustering" method).
  • the prediction of the user's behavior is expressed according to the interests of the user and the user's commitment to a content.
  • the content is, for example, one or more web pages accessible locally, third-party content inserted in the content page, advertising messages.
  • the recommended content for its part, is typically generated by the content delivery module 150, from one of the data sources 162, 164 of a third party publisher or an advertiser, wishing to target the current context. of the user, but also more finely his real interest.
  • the method of predicting the interest of the user is adapted to provide personalized content to the user by analyzing:
  • classified and characterized content of the viewed content for example page views of a website, during a navigation session established by means of the navigation module 110; and or
  • commitment of the user, in a behavioral way, according to the interactions on the pages transmitted by the content server module 120 to the navigation module 110.
  • the advertising engagement is often the fact for a user to interact with an advertising element beyond and otherwise than by clicking.
  • the concept of commitment is mainly used for so-called "rich media" formats in English, and is an indicator of efficiency complementary to click rates and indicators after-viewing (or "post-view" in English).
  • commitment can be achieved by:
  • the method for predicting the behavior of the user comprises a step 210 of collecting, during a current session, information relating to new interactions of the user, by means of the navigation module 110, with pages provided. by the content server module 120.
  • the step 210 is executed periodically, or after detection of a new interaction of the user on a content or a web page provided by the content server module 120 to the navigation module 110
  • the information relating to the new interactions is collected for one and the same Internet site, and is for example related to the content of the pages viewed, to the keywords entered by the user, to the actions and / or inputs of the user to perform search and / or access new information within the same site - links, filters, search by image, etc.
  • the collection of information thus relates exclusively to data accessible during the current session of the user: no information relating to a browsing history of the user on the internet is collected. In addition, cookies are not used to identify the user.
  • the method for predicting the behavior of the user comprises a step 220 for accessing, during a current session, information relating to interactions of the user, by means of the navigation module 110, with pages provided. by the content server module 120.
  • information relating to interactions is obtained for a single Internet site, and is for example related to the content of the pages viewed, to the keywords entered by the user, to the actions and / or inputs of the user to perform a search and / or access new information within the same site - links, filters, search by image, etc.
  • the collection of information thus relates only to the data accessible during the current session of the user: no information relating to a browsing history of the user on the internet is collected. In addition, cookies are not used to identify the user.
  • the method for predicting the behavior of the user comprises a step 230 of merging the information relating to the new user interactions obtained during step 210, with the information relating to the user's interactions obtained during the process. step 220, namely with the history of its current session.
  • the method for predicting the user's behavior comprises a step 240 of determining and refining the context making it possible to define and then to improve in precision the centers of interest of the user, based on the data merged in the course of time. step 230.
  • step 240 At the end of step 240, at least one context and / or a point of interest of the user is / are determined and / or refined, by combining:
  • the center (s) of interest of the user is / are determined (s), during step 240, according to one or more ontologies or thesauri of reference to a plurality of concepts illustrating diverse and varied centers of interest.
  • the user behavior prediction method includes a step 250 of determining and refining the user's commitment, based on the merged behavioral data in step 230. More particularly, at the end of step 250, at least one measure of the commitment of the user is determined and / or refined, depending on the interactions of a behavioral nature on the pages transmitted by the content server module 120 to the module of navigation 110, obtained from the merged data in step 230.
  • the behavior of a user exploring a content on a website, or provided through an application is characterized by all of the user's interactions with the human-machine interface.
  • the behavior is elaborated from the set of events reflecting all the human actions positioned on a time axis.
  • it may be the following events:
  • the user engagement prediction method includes a step 260 characterizing the "center of interest” and the “commitment” of the user, based on the user's focus variables determined in step 240 and the user engagement variables determined in step 250.
  • a degree of user intent is obtained.
  • the characterization of the current session of the user is obtained by:
  • session data being typically previously obtained from a plurality of anonymous data collected during sessions, on a plurality of web sites, many users;
  • Machine Learning techniques can be used in particular to classify the interest and the commitment of the user in relation to a multitude of session groups, in order to propose to advertisers and publishers the purchase of advertising inserts or sponsored content in which they will offer personalized content closest to the user's interest and knowing in advance its current level of engagement with the content presented.
  • the user behavior prediction method includes a step 270 of selecting a personalized content from a set of content, based on the focus and commitment degree determined in step 260, then is transmitted to the navigation module 110 for display.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

La présente invention est adaptée à être mise en œuvre pour d'un moteur de recherche permettant les itérations lors de la recherche de contenu. L'invention détermine et diffuse un contenu personnalisé, en : • collectant des informations relatives à au moins une interaction d'un utilisateur • déterminant au moins au moins un centre d'intérêt de l'utilisateur, • déterminant au moins une mesure de l'engagement de l'utilisateur, • déterminant une caractérisation du contexte liée à la session courante et d'un degré d'intérêt de l'utilisateur • diffusant, au module de navigation, un contenu personnalisé en fonction de la caractérisation du centre d'intérêt et du degré d'engagement déterminés.

Description

Moyens de diffusion d'un contenu personnalisé dans un réseau de communication
La présente invention se rapporte au domaine de la diffusion, dans un système d'information, d'informations personnalisées de manière automatisée. L'invention concerne plus particulièrement des moyens de mise en œuvre, dans un réseau de communication, d'espaces de diffusion d'informations personnalisées à destination d'un utilisateur, en fonction d'intérêts propres audit utilisateur. Les espaces de diffusion d'informations peuvent être en particulier des espaces publicitaires, ou des espaces réservés à du contenu recommandé, destinés à être affichés, soit dans une page d'un site internet consulté par l'utilisateur, au cours d'une session ouverte au moyen d'un logiciel de navigation web, soit au sein d'une application embarquée sur un équipement mobile (téléphone mobile, appelé aussi Smartphone selon le terme anglo-saxon, ou tablette) lors de sa consultation. De nombreux sites internet, et applications sur équipement mobile, proposent de personnaliser une partie des contenus — en particulier, mais non exclusivement, les messages à caractère publicitaire — diffusés à un utilisateur, en fonction des activités de ce dernier sur les multiples sites internet précédemment consultés. À titre d'exemple, les annonceurs en ligne sont particulièrement intéressés par la possibilité d'identifier, en amont, les utilisateurs intéressés par un contenu présenté, et en particulier les utilisateurs étant susceptibles ou ayant l'intention d'acheter un produit.
Une première approche, adaptée aux sites internet comportant un moteur de recherche, peut consister à afficher un contenu personnalisé, en fonction par exemple de mots-clés saisis par l'utilisateur et utilisés pour expliciter une requête de recherche. Si cette première approche peut s'avérer efficace, la personnalisation de contenu reste insuffisante quant à la compréhension précise et en temps-réel du centre d'intérêt, de l'engagement de l'utilisateur (c'est-à-dire sa réceptivité vis-à-vis d'un contenu), et de ses intentions propres. Des témoins de connexion, plus couramment désignés par le terme anglo-saxon « cookies », gérés par le logiciel de navigation web, ou par la connexion à une application sur un équipement mobile avec le nom de l'utilisateur et son mot de passe (par exemple lors de son téléchargement), sont typiquement employés à cette fin. Dans le cas de la diffusion de publicité, les témoins de connexion permettent ainsi d'identifier l'utilisateur de façon unique en tant que consommateur et de lui proposer un message publicitaire, sur le site courant ou l'application consultés, en rapport avec ses intérêts et recherches passés précédemment enregistrés. Cette méthode de personnalisation de contenus, s'appuyant sur ces témoins de connexion, est usuellement désignée par les termes de « Reciblage publicitaire ». Le ciblage publicitaire est alors basé sur la reconnaissance individuelle de l'utilisateur associée à son historique de ses précédentes consultations, et permet ainsi de cibler l'utilisateur sur la base de ses centres d'intérêt passés, d'où le terme de « reciblage », l'utilisateur étant déjà connu de l'annonceur.
Ainsi, la plupart des méthodes de personnalisation utilisées par les systèmes de profilage existants nécessitent l'identification de l'utilisateur de façon unique, et la personnalisation du contenu repose sur l'enregistrement d'un historique de données propres à cet utilisateur. Les données enregistrées sont collectées à partir d'un même site — par exemple un site de commerce en ligne —, ou à partir de plusieurs sites, regroupés au sein d'un même réseau d'achat d'espaces publicitaires, ou de recommandations de contenus. Dans cette dernière configuration, un même service d'identification et de profilage de l'utilisateur est typiquement utilisé pour stocker le profil de l'utilisateur, comportant par exemple des informations relatives à ses intérêts (précédents sites et pages consultés, précédentes recherches faites avec des mots-clés) et à son comportement lors des visites précédentes d'un ou plusieurs sites internet.
Or, identifier de manière unique un utilisateur pose de nombreux problèmes. En effet, bien qu'il ne soit pas toujours nécessaire de connaître l'identité de l'utilisateur ou son profil marketing (par exemple, son nom, s'il est un homme ou une femme, le segment socio-démographique...), cette pratique peut aller, dans certains cas, à rencontre des règles relatives aux respects de la vie privée, prescrites par diverses lois selon la/(les) juridiction(s) concernée(s). En outre, les logiciels de navigation ainsi que des moyens techniques complémentaires permettent de limiter voire d'interdire l'utilisation de témoins de connexion, ce qui peut rendre cette méthode inopérante, en l'absence d'un procédé pertinent de ciblage.
C'est pourquoi il existe encore un besoin pour des moyens de diffusion d'un contenu personnalisé dans un réseau de communication qui puissent garantir l'anonymat de l'utilisateur, et qui soient aptes à fonctionner sans l'utilisation de témoins de connexion. L'invention vise à fournir des moyens de mise en œuvre, dans un réseau de communication, d'espaces de diffusion d'informations personnalisées à destination d'un utilisateur, en fonction du centre d'intérêt courant de l'utilisateur, et donc spécifique à sa consultation actuelle, et non à ses navigations passées, voire sur d'autres sites. Les espaces de diffusion d'informations peuvent être en particulier des espaces publicitaires, destinés à être affichés dans une page d'un site internet consulté par l'utilisateur, au cours d'une session ouverte au moyen d'un logiciel de navigation web, ou au sein d'une application sur un équipement mobile.
L'invention vise également à proposer des moyens techniques adaptés à la mise en œuvre d'une infrastructure de vente d'espaces publicitaires, basés sur l'affinage itératif du centre d'intérêt de l'utilisateur à partir de données extraites du contenu du site internet consulté au cours de la session courante de l'utilisateur, et sans considération de l'historique des navigations passées de cet utilisateur sur ce même site web ou d'autres sites web. L'invention a également pour objet la prise en compte de l'engagement de l'utilisateur avec le contenu présenté, lors d'une session, tenant compte des interactions de l'utilisateur, et de la façon dont le contenu est consommé.
L'invention a également pour objet de permettre la caractérisation du comportement d'un utilisateur, de façon anonyme, vis-à-vis d'un sujet en termes de degré d'engagement c'est-à-dire de réceptivité du sujet. L'invention a également pour objet de permettre la caractérisation du comportement d'un utilisateur vis-à-vis d'un sujet, et de façon anonyme, en termes d'intention de l'utilisateur, de sorte à permettre la détermination d'une probabilité que l'utilisateur interagisse avec une publicité, et, le cas échéant, à rediriger l'utilisateur vers un autre site à partir duquel un achat pourrait être réalisé.
L'invention vise également à proposer des moyens techniques pour une infrastructure de vente d'espaces publicitaires basée sur l'affinage itératif, ces moyens étant aptes à permettre la caractérisation et l'amélioration en précision du centre d'intérêt par affinage itératif, en fonction de l'ensemble du parcours dans le contenu consulté, à savoir la navigation dans les pages, les actions sur le contenu, les différentes recherches par menus et filtres ou par mots-clés, les sélections de contenus en positif et/ou en négatif, et plus généralement l'ensemble des actions et requêtes successives réalisées au titre de la recherche courante, y compris leurs enchaînements et leurs variations au sein du cycle itératif de la recherche. L'invention n'est donc pas limitée à l'expression de la dernière action ou requête de la recherche dans le contenu. Un ou plusieurs de ces objets sont remplis par le procédé de diffusion, le programme d'ordinateur, le support, le module, et le système objets des revendications indépendantes. Les revendications dépendantes fournissent en outre des solutions à ces objets et/ou d'autres avantages.
Dans la présente description, par « centre d'intérêt », on se réfère à ce qui caractérise et synthétise le « contexte », à savoir le contenu lui-même des pages vues, les métadonnées des pages, celles-ci pouvant ne pas être affichées, mais aussi le déroulement de la session, tel que la suite des interactions, le cheminement de navigation, toute sélection de contenus, et plus généralement le contenu lui-même ainsi que toutes les actions permettant d'obtenir le contenu visualisé au court de la session. Le centre d'intérêt comprend, entre autres, les actions de sélection de contenu telles que :
• les actions de navigation dans le contenu et les thèmes des pages vues ;
• les actions disponibles par menu, par filtrage ;
• les appréciations exprimées par l'utilisateur sur un contenu (par exemple, l'ajoutd' une mention « j'aime », etc.) ;
• les actions de recherches de contenus pouvant utiliser des mots-clés, ou toutes autres actions sur du contenu : j'aime/je n'aime pas,... et pouvant aussi contribuer à la recherche de contenu par un moteur de recherche textuel et multimédia.
Dans la présente description, par « engagement de l'utilisateur », on se réfère à la réceptivité de l'utilisateur au contenu, et qui peut être mesuré par la façon dont le contenu est consulté et l'interactivité de l'utilisateur avec le contenu. L'engagement est essentiellement de nature comportementale, dont voici quelques exemples pour illustration :
• le fait de lire un article jusqu'au bout, ce qui peut être identifié par le défilement à l'aide de l'ascenseur de la page correspondante jusqu'à la fin de l'article ;
· le fait de laisser se jouer une vidéo, sans fermer ou mettre fin à la lecture de cette dernière de façon anticipée ; • le fait d'interagir avec un site web ou avec une application permettant d'exprimer une préférence par « J'aime » / « Je n'aime pas », dénote un plus ou moins grand Intérêt au contenu présenté, mais aussi un engagement fort par l'interactivité ;
· etc.
Dans la présente description, par « variable d'engagement » sur un certain nombre d'aspects, on se réfère à des informations relatives à l'engagement de l'utilisateur, comme par exemple, un pourcentage de la partie affichée d'un article, un temps d'affichage de l'article, un pourcentage de lecture d'une vidéo, un nombre de clics au cours de la session, etc., ainsi que toutes combinaisons de variables pouvant être calculées (par exemple sur une échelle de 0 à 10), et pouvant permettre aussi de déterminer des paramètres plus globaux, tels que :
• un degré d'Intérêt : lecture/attention au contenu (défilement de texte, regarde les images, visualise les vidéos) ;
• un degré d'Interactivité avec le contenu : défilement du contenu partiel ou complet, rapide ou lent, recherches, navigation,...
Dans la présente description, par « degré d'Intention », on se réfère à une probabilité de cliquer sur les liens vers d'autres contenus ou des publicités présentées.
Plus particulièrement, selon un premier aspect, l'invention se rapporte à un procédé de diffusion d'un contenu personnalisé, dans un réseau de communication, à un module de navigation, au cours d'une session établie entre le module de navigation et un module serveur de contenu, dite session courante. Le module serveur de contenu peut être un site web, ou encore une source de données adaptées pour être utilisées par le module de navigation. Le module de navigation peut être notamment un navigateur web, ou une application adaptée pour être exécutée par un terminal et configurée pour utiliser des données fournies par le module serveur de contenu. Le procédé comporte les étapes suivantes :
• une première étape de collecte d'informations relatives à au moins une interaction d'un utilisateur, au moyen du module de navigation, avec au moins une page de contenu élaborée au moins partiellement à partir de données transmises par le module serveur de contenu ; • une deuxième étape de détermination d'au moins une variable de contexte relative à au moins un centre d'intérêt de l'utilisateur, en fonction des informations relatives à ladite au moins une interaction d'un utilisateur collectée au cours de la première étape ;
· une troisième étape de détermination d'au moins une variable d'engagement de l'utilisateur avec ladite au moins une page de contenu, en fonction des informations relatives à ladite au moins une interaction d'un utilisateur collectée au cours de la première étape ;
• une quatrième étape de caractérisation de la session courante en fonction d'un ensemble historique de données de sessions antérieures anonymisées :
o du contexte en fonction de ladite au moins une variable de contexte relative à au moins un centre d'intérêt de l'utilisateur; et o de ladite au moins une mesure de l'engagement de l'utilisateur ou d'au moins une mesure du degré d'intérêt de l'utilisateur, en fonction de ladite au moins une variable d'engagement déterminée au cours la troisième étape ;
• une cinquième étape de diffusion au module de navigation, d'un contenu personnalisé en fonction de la caractérisation du contexte et de la caractérisation de ladite au moins une mesure du degré d'engagement ou ladite au moins une mesure du degré d'intérêt, déterminés au cours de la quatrième étape.
Au cours de la cinquième étape, le contenu personnalisé pour l'utilisateur peut être déterminé et/ou sélectionné par un module de mise à disposition de contenus, en fonction de la caractérisation du contexte et de la caractérisation de ladite au moins une mesure du centre d'intérêt, et de ladite au moins une mesure du degré d'engagement déterminés au cours de la quatrième étape. Le module de mise à disposition de contenus peut appartenir au système selon le cinquième aspect, ou être géré par un tiers.
Au cours de la première étape, la collecte d'informations relatives à au moins une interaction d'un utilisateur peut être réduite à la collecte d'une information élémentaire, par exemple la collecte d'un unique mot-clé, lors d'une première recherche de contenu. En particulier, ladite au moins une page de contenu peut être une page web transmise au module de navigation au cours de la session. L'invention permet de prendre en compte des informations allant au-delà d'une première caractérisation du centre d'intérêt obtenue à la suite de la saisie par l'utilisateur d'un ou plusieurs mot-clés initiaux ou d'un résumé sémantique d'une page. L'invention permet notamment de prendre en compte plusieurs pages successives de contenu ou plusieurs itérations de recherches basées sur des mots- clés, et toutes préférences, en positif ou en négatif, exprimées par l'utilisateur sur des contenus présentés sucessivement. L'invention permet donc de prendre en compte le cheminement de la recherche entreprise par l'utilisateur, en particulier les informations saisies ou sélectionnées, mais aussi les informations consultées au cours d'une succession de requêtes de recherches ayant généré de multiples listes de résultats. Il est donc alors possible de caractériser de façon optimale le centre d'intérêt de l'utilisateur, qui n'est pas réduit juste à la prise en compte de la dernière requête, ou interaction de l'utilisateur, et en conséquence fournir un contenu personnalisé pertinent lié à l'ensemble de la session courante de l'utilisateur et jusqu'à sa dernière requête ou interaction comprise.
Les étapes du procédé selon l'invention peuvent en outre être répétées, par exemple périodiquement ou sur détection d'un événement particulier, tel qu'une nouvelle interaction de l'utilisateur avec le module de navigation.
Le module de navigation peut être mis en œuvre depuis un ordinateur personnel, ou depuis une application sur un équipement mobile. En particulier, la première étape peut être exécutée périodiquement, ou après détection d'une nouvelle interaction de l'utilisateur sur une page de contenu transmise par le module serveur de contenu. Ainsi, il est possible de déterminer et améliorer à chaque nouvelle interaction de la part de l'utilisateur, le contenu personnalisé proposé au module de navigation.
Le procédé de diffusion d'un contenu personnalisé selon le premier aspect est adapté notamment pour être mis en œuvre par un système de vente d'espaces publicitaires par affinage. Le procédé selon le premier aspect permet ainsi d'affiner, par itération, d'une part, l'intérêt courant de l'utilisateur, en termes de centre d'intérêt actuel, et, d'autre part, la mesure de son engagement vis-à-vis du contenu présenté, en rapport à son centre d'intérêt actuel, et/ou la prédiction du degré d'engagement, tel que l'intention d'achat potentiel (dans le cas de produits ou services commerciaux). En collectant sur le seul et même site web consulté, ou sur le serveur de contenu alimentant l'application, le contenu des pages regardées, les mots-clés ainsi que les données d'interactions ou tout autre moyen de recherche et d'accès à de nouvelles informations, et seulement pour la session courante de consultation et/ou de recherche de l'utilisateur, le procédé permet de ne pas utiliser l'historique propre de navigation sur internet de l'utilisateur, et ne nécessite pas, en particulier, l'utilisation de témoins de connexion pour l'identification de l'utilisateur et l'accès à son historique. En effet, le procédé selon le premier aspect permet d'analyser l'activité courante de l'utilisateur, c'est-à-dire son activité durant la session courante, et d'en déduire la signature de la session courante, en la comparant à de multiples sessions précédemment profilées et anonymisées, en regard de l'activité de précédents utilisateurs ayant accédé aux mêmes types d'information sur le même site web et ayant eu des comportements et des contextes similaires.
L'activité de l'utilisateur peut être caractérisée et affinée de façon itérative par les informations sur le contexte observé— pouvant être des mots-clés dans le cas d'un moteur de recherche ayant servi à obtenir les informations visualisées —, par le centre d'intérêt réel de l'utilisateur obtenu par déduction de la navigation courante de l'utilisateur sur le site actuellement parcouru, et le niveau d'intérêt de l'utilisateur pour les sujets des pages consultées. Le niveau d'intérêt de l'utilisateur pour un sujet est déterminé notament par la façon dont il interagit avec les informations du site, par la façon dont il recherche l'information (par liens, par mots- clés, l'enchaînement des interactions, etc.) et les différents formats de contenus visionnés (pages textuelles, images, et vidéos, et leurs combinaisons). Ce niveau d'intérêt peut être rapproché d'expériences similaires de la part d'autres utilisateurs, et peut être caractérisé par le degré d'intérêt pour le contenu ou degré d'intention au sens achat potentiel, lorsqu'il s'agit de produits ou de services commercialisables.
Ladite au moins une interaction de l'utilisateur avec ladite au moins une page de contenu, par exemple une page web transmise par le module serveur de contenu, peut être relative à l'une ou à une combinaison d'interactions parmi la liste suivante, mais non limitative : consultation d'une page de contenu/web, consultation d'une sous-section d'une page de contenu/web via un lien ou un menu, saisie d'un mot-clé, expression d'un intérêt ou un non-intérêt pour un document multimédia, action et/ou saisie de l'utilisateur pour effectuer une recherche de contenus, action de navigation et/ou saisie de l'utilisateur pour accéder à de nouvelles informations au sein du serveur de de contenu, ou du site web. Au cours de la deuxième étape, ladite au moins une variable de contexte peut être déterminée, en fonction du contenu de ladite au moins une page de contenu ou page web transmise au module de navigation au cours de la session et/ou d'informations non visibles pour l'utilisateur attachées audit contenu, telles que des métadonnées.
Au cours de la deuxième étape, ladite au moins une variable de contexte, peut être déterminée, pour une part le cas échéant, en fonction d'une sélection et/ou d'une combinaison, en entrée, de critères, et/ou d'actions et/ou d'objets utilisés par l'utilisateur pour formuler, au moyen du module de navigation, une requête de recherche de contenu personnalisé, destinée à un module de recherche associé au module serveur de contenu. Dans ce cadre, les critères considérés peuvent être basés sur les termes utilisés par l'utilisateur, soit directement, soit indirectement, par exemple dans le cas de métadonnées associées à des documents sélectionnés.
Au cours de la deuxième étape, la dite au moins une variable de contexte peut être déterminée, en fonction d'une sélection et/ou d'une combinaison, en entrée, d'au moins une information textuelle et/ou au moins un objet multimédia, pour formuler la requête de contenu personnalisé, destinée au module de recherche associé au module serveur de contenu. La requête peut notamment être issue d'un moteur de recherche. Ledit au moins objet multimédia peut en particulier être un objet multimédia sans limitation sur le type de format informatique de l'objet, par exemple une vidéo, une image, un fichier son, un fichier pdf, une fiche produit E- Commerce... Ledit au moins objet multimédia peut être sélectionné par l'utilisateur, directement ou indirectement. La requête peut être construite par itérations successives de sorte à affiner le contenu personnalisé au cours d'une même session. En particulier, la requête peut être construite par itération de sélections de l'utilisateur d'objets multimédia et/ou de saisies textuelles, et par propositions, combinaisons et affinages successifs des résultats par le moteur de recherche. A titre d'exemple, le module de recherche associé au module serveur de contenu peut être mis en oeuvre par les moyens décrits dans le document WO 2014/191703.
Au cours de la deuxième étape, ladite au moins une variable de contexte peut être déterminée, en fonction du contenu de ladite au moins une page de contenu transmise au module de navigation, ou de mot-clés collectés au cours de la première étape, et en fonction d'au moins une ontologie de référence relative à une pluralité de concepts. La pluralité de concepts de l'ontologie de référence a par exemple trait aux sujets consultés du domaine, ou pouvant être pertinents comme segments marketing à vocation de ciblage publicitaire.
Au cours de la troisième étape, ladite au moins une variable d'engagement de l'utilisateur avec ladite au moins une page de contenu transmise par le module serveur de contenu internet peut être déterminée en fonction des informations relatives à ladite au moins une interaction d'un utilisateur collectée au cours de la première étape.
L'ensemble historique de données de sessions antérieures comporte par exemple des données anonymes collectées lors de sessions d'utilisateurs établies entre des modules tiers de navigation et le module serveur de contenu. Les sessions d'utilisateurs peuvent notamment correspondre à des sessions d'utilisateurs ayant précédemment accédé au contenu sur le module serveur de contenu, sans nécessairement avoir été identifiés.
La caractérisation du contexte peut en particulier être réalisée en vue d'élaborer ledit au moins un centre d'intérêt de l'utilisateur. Aussi, au cours de la quatrième étape, la caractérisation du contexte peut être déterminée :
• en élaborant une signature de la session, en fonction de ladite au moins une variable de contexte ;
• en comparant la signature de la session avec l'ensemble historique de données de sessions antérieures anonymisées d'utilisateurs, pour déterminer des sessions historisées antérieures ayant une signature présentant la plus grande proximité avec la signature de la session ;
• en utilisant un modèle de classification, pour déterminer les caractéristiques de la session courante de l'utilisateur, en fonction de caractéristiques associées aux sessions historisées ayant une signature présentant la plus grande proximité, en termes de classification, avec la signature de la session courante.
Pour déterminer la similarité par rapport à un modèle de classification, la proximité de la session courante peut être calculée selon une fonction de distance entre sessions selon des techniques d'apprentissage automatiques. Ce modèle de classification peut être contraint, par exemple pour refléter une micro-segmentation marketing, à l'aide de techniques d'apprentissage automatique ou apprentissage statistique (« machine learning » en anglais) afin de correspondre à une ontologie de référence du domaine quant au sujet consulté, ou à une ontologie adaptée à un usage de ciblage publicitaire, pour en définir le segment marketing. De même le parcours itératif de consultation du contenu par l'utilisateur, mais aussi lors d'une recherche de contenu par un moteur de recherche itératif, permet de mettre en œuvre des techniques d'apprentissage par renforcement (« Reinforcement learning » en anglais) permettant un apprentissage automatique. Le but de cet apprentissage automatique est d'apprendre à partir des sessions historisées et de proposer ainsi, pour toute nouvelle session, du contenu personnalisé ou des publicités ciblées de façon optimisée selon des critères d'engagement prédéfinis, tels que, mais non limités à, un taux de clic sur le contenu, ou un taux de clic sur la publicité.
Au cours de la cinquième étape, le contenu personnalisé peut être :
• sélectionné parmi un ensemble de contenus, en fonction de la caractérisation du contexte selon ladite au moins une mesure du centre d'intérêt et de la caractérisation de ladite au moins une mesure du degré d'engagement ;
· transmis au module de navigation ;
• affiché par le module de navigation.
La sélection parmi un ensemble de contenus peut être réalisée par un module d'un site web, sur le serveur de contenu, ou par un module hébergé sur un serveur tiers responsable de fournir du contenu personnalisé, ou des publicités dites contextuelles.
Selon un deuxième aspect, l'invention se rapporte à un programme d'ordinateur comportant des instructions pour l'exécution des étapes du procédé selon le premier aspect, lorsque ledit programme est exécuté par un processeur. Chacun de ces programmes peut utiliser n'importe quel langage de programmation, et être sous la forme de code source, code objet, ou de code intermédiaire entre code source et code objet, par exemple dans une forme partiellement compilée, ou dans n'importe quelle autre forme souhaitable. En particulier, il est possible d'utiliser le langage C/C++, le langage Java™, des langages de script, tels que notamment tel, JavaScript, python, Perl qui permettent une génération de code « à la demande » et ne nécessitent pas de surcharge significative pour leur génération ou leur modification.
Selon un troisième aspect, l'invention se rapporte à un support d'enregistrement lisible par un ordinateur sur lequel est enregistré un programme d'ordinateur comprenant des instructions pour l'exécution des étapes du procédé selon le premier aspect. Le support d'informations peut être n'importe quelle entité ou n'importe quel dispositif capable de stocker le programme. Par exemple, le support peut comporter un moyen de stockage, tel qu'une ROM, par exemple un CD-ROM ou une ROM de circuit microélectronique, ou encore un moyen d'enregistrement magnétique, par exemple une disquette ou un disque dur. D'autre part, le support d'informations peut être un support transmissible tel qu'un signal électrique ou optique, qui peut être acheminé par un câble électrique ou optique, par radio ou par d'autres moyens. Le programme selon l'invention peut être en particulier téléchargé sur un réseau internet ou Intranet. Alternativement, le support d'informations peut être un circuit intégré dans lequel le programme est incorporé, le circuit étant adapté pour exécuter ou pour être utilisé dans l'exécution du procédé en question.
Selon un quatrième aspect, l'invention se rapporte à un module adapté pour diffuser un contenu personnalisé, dans un réseau de communication, à un module de navigation, au cours d'une session établie entre le module de navigation et un module serveur de contenu. Le module comporte :
• un module configuré pour collecter des informations relatives à au moins une interaction d'un utilisateur, au moyen du module de navigation, avec au moins une page de contenu élaborée au moins partiellement à partir de données transmises par le module serveur de contenu ;
• un module configuré pour déterminer au moins une variable de contexte relative à au moins un centre d'intérêt de l'utilisateur, en fonction des informations relatives à ladite au moins une interaction d'un utilisateur ;
• un module configuré pour déterminer au moins une variable d'engagement de l'utilisateur avec ladite au moins une page de contenu, en fonction des informations relatives à ladite au moins une interaction d'un utilisateur ;
• un module configuré pour déterminer, en fonction d'un ensemble historique de données de sessions antérieures anonymisées : o une caractérisation du contexte en fonction de ladite au moins une variable de contexte relative à au moins un centre d'intérêt de l'utilisateur; et
o une caractérisation de ladite au moins une mesure de l'engagement de l'utilisateur ou d'au moins une mesure du degré d'intérêt de l'utilisateur, en fonction de ladite au moins une variable d'engagement ;
• un module configuré pour diffuser, au module de navigation, un contenu personnalisé en fonction de la caractérisation du contexte et de la caractérisation de ladite au moins une mesure du degré d'engagement ou ladite au moins une mesure du degré d'intérêt.
Selon un cinquième aspect, l'invention se rapporte à un système comportant un module de navigation, un module serveur de contenu et un module selon le quatrième aspect.
D'autres particularités et avantages de la présente invention apparaîtront à la lecture de la description qui suit, faite en référence aux dessins annexés, dans lesquels :
- la figure 1 est une représentation schématique d'un système de mise en œuvre d'espaces de diffusion d'informations personnalisées à destination d'un utilisateur, selon un mode de réalisation de l'invention ;
la figure 2 est un synoptique des étapes d'un procédé de prédiction du comportement de l'utilisateur, selon un mode de réalisation de l'invention ;
la figure 3 est un schéma, selon un mode de réalisation, d'un module de navigation selon l'invention.
Dans la présente description, le terme « session » se réfère à la période au cours de laquelle un utilisateur, produit une série de requêtes au moyen de son logiciel de navigation au cours d'une visite d'un site web, ou à partir d'une application sur un équipement mobile accédant le serveur de contenu. Ainsi, dans le contexte de l'accès à un site serveur de contenu, une session se réfère à une période délimitée pendant laquelle un même serveur de contenu communique et réalise des opérations au bénéfice d'un utilisateur, connecté au moyen d'un module informatique exécutant un logiciel d'accès au contenu. Pour déterminer la période correspondant à une session, un mécanisme de gestion de session, pouvant par exemple, entre autres moyens, utiliser le mécanisme de gestion de session associé à l'interface utilisateur, peut être utilisé pour déterminer pour chaque nouvelle interaction de l'utilisateur, le cas échéant, le début d'une nouvelle session, la continuité d'une session déjà engagée, et/ou la fin de la session, pour un même navigateur internet sur le même terminal, pour une même application sur l'équipement mobile, sur la base de critères informatiques, tels que la création d'une nouvelle session par le navigateur, ou de critère temporel, suite à l'expiration de la session sur la base d'un compteur temporel d'inactivité. De même, les critères précédents peuvent être complétés ou combinés à un critère de cohérence thématique élaboré à partir du contexte, et basé sur la proximité sémantique du contenu consulté selon une ontologie de référence, au sein d'un module de gestion de session permettant de forcer la fin de la session courante, dans le cas d'une trop grande divergence de sujets, et de ce fait déclencher le démarrage d'une nouvelle session.
On se réfère à la figure 1, sur laquelle est représenté, selon un mode de réalisation de l'invention, un système de mise en œuvre d'espaces de diffusion d'informations personnalisées à destination d'un utilisateur. Plus particulièrement, le système peut être un système de mise en œuvre d'espaces publicitaires avec caractérisation et affinage itératif de l'intention d'un utilisateur en termes de centre d'intérêt et d'engagement. Le système est configuré pour collecter et utiliser, à cette fin, des informations relatives à des données contextuelles et comportementales recueillies lors d'interactions de l'utilisateur avec les pages d'un site internet, ou avec une application résidant sur un équipement mobile. Ces informations propres à l'utilisateur sont typiquement obtenues au cours d'une même activité de navigation ou de recherche, pouvant éventuellement utiliser un moteur de recherche, sur le site actuellement parcouru par l'utilisateur. La collecte de ces informations est limitée dans le temps, par exemple au cours d'une même session, caractérisée le plus souvent par une durée limitée, et un même centre d'intérêt de la part de l'utilisateur.
Le système comporte un module de navigation 110 adapté pouvant être en particulier un logiciel de navigation, ou une application sur un équipement mobile, tel qu'un Smartphone ou une Tablette. Le logiciel de navigation permet à un utilisateur du module de navigation 110 d'accéder aux pages d'un site web ou à un serveur de contenus, et de les consulter et/ou interagir avec lesdits pages ou contenu. Le module de navigation 110 peut être en particulier embarqué dans un ordinateur, dans un terminal de communication mobile, dans un système connecté, etc. Le système comporte un module serveur de contenu 120, couplé à internet et hébergé par ou pour le compte d'un éditeur de contenus, adapté à stocker, générer et transmettre des pages web ou du contenu, au module de navigation 110, sur requête de ce dernier. Le module serveur web 120 est couplé à un module de profilage de session 130. Le module de profilage de session 130 utilise une ou plusieurs techniques d'intelligence artificielle, d'apprentissage par clusterisation, d'apprentissage par renforcement, afin de déterminer la signature de la session courante, et de la recalculer à chaque nouvelle itération, en prenant en compte l'historique de l'ensemble de la session. La signature de la session recalculée lors de la dernière itération est comparée et classifiée en regard des sessions précédentes anonymisées d'utilisateurs. Le profilage par classification permet d'élaborer en retour au moins un centre d'intérêt, et au moins une mesure du degré d'engagement. Le module de profilage de session 130 transmet alors au module éditeur serveur de contenus personnalisés 140 le centre d'intérêt de la session pouvant être l'étiquette, à savoir le nom du cluster de sessions dans lequel la session a été affectée, et augmenté d'attributs supplémentaires pouvant préciser une classification plus fine. De même le module de profilage de session 130 détermine le niveau d'engagement et délivre un ou plusieurs paramètres qualifiant l'engagement de l'utilisateur, à savoir le degré d'intérêt ou d'intention vis-à-vis du contenu présenté.
Le système comporte un module éditeur serveur de contenus personnalisés 140, couplé au module de profilage de session 130 et à un module de mise à disposition de contenus 150, pouvant aussi être opéré par un tiers. Ledit au moins un centre d'intérêt et au moins une mesure du degré d'engagement sont fournis par le module éditeur serveur de contenus personnalisés 140 par une API au module de mise à disposition de contenus 150 qui détermine le contenu le plus adapté à l'utilisateur en fonction des éléments qui lui sont fournis et d'une logique interne de décision. Le module de mise à disposition de contenus 150 peut en particulier être un système adapté de vente publicitaire, ou de recommandation de contenus d'éditeurs, pour mettre à disposition des contenus fournis par une pluralité d'annonceurs, ou d'éditeurs tiers, en provenance de sources de données 162, 164. Ainsi le contenu personnalisé est déterminé par le module de mise à disposition de contenus 150 à l'extérieur de l'environnement de l'utilisateur sans témoin de connexion récupéré au sein du module de navigation 110 (par exemple de type cookie, tag,...) et sans interaction directe avec cet environnement. De même, l'information d'identité (ou tout autre moyen de reconnaissance de l'utilisateur) n'est pas utilisée dans la détermination du contenu personnalisé, car seules les informations provenant de la session anonymisée, fournies par le module éditeur serveur de contenus personnalisés 140, sont utilisées pour la prise de décision du module de mise à disposition de contenus 150.
Le système comporte un module serveur de contenus personnalisés 170, couplé au module de mise à disposition de contenus 150, qui assurera la mise en œuvre du contenu personnalisé en interaction avec le module de navigation 110.
Le serveur de contenus personnalisés 170 est également couplé à un module de traçage de l'affichage des informations personnalisées 190, tel qu'affiché sur le module de navigation 110, et interagissant avec le module serveur de contenu 120 et/ou le module de navigation 110, permettant de mesurer l'affichage du contenu personnalisé, garant ainsi de la bonne exécution d'un contrat d'affichage, celui-ci pouvant être de type commercial avec des tiers.
Le système peut comporter un réseau de distribution de contenu 180, couplé au module de navigation 110 et au module annonceur serveur de contenus personnalisés 170, pour en optimiser l'efficacité en termes de temps de réponse et d'affichage.
La figure 3 représente un mode de réalisation détaillé du module de navigation 110. Le module de navigation 110 comporte une interface utilisateur 310, typiquement un écran, et des moyens d'interactions avec un utilisateur comme un clavier, une surface tactile, des capteurs, etc. L'interface utilisateur est notamment adaptée pour afficher des contenus transmis par un module serveur de contenu 120.
Le module de navigation 110 comporte un module de collecte 320 de données élémentaires de session. Le module de collecte 320 est configuré pour obtenir, au moyen du module de navigation 110, des informations relatives aux interactions de l'utilisateur avec le contenu présenté, dont par exemple des pages web, fournies par le module serveur de contenu 120. Les informations collectées (loggées selon le mot anglo-saxon) par le module de collecte 320 sont relatives par exemple au contenu des pages regardées, aux mots-clés saisis par l'utilisateur, aux actions et/ou saisies de l'utilisateur pour effectuer une recherche et/ou naviguer pour accéder à de nouvelles informations au sein du même site — à l'aide de liens, de filtres, de tous types de recherches, par exemple par image, etc.
Le module de navigation 110 comporte un module de classification itérative 330, fonctionnant en temps réel, couplé à des moyens de stockage 340 pour la session courante et à une base de données d'historiques de sessions 350. Le module de classification itératif 330 est notamment configuré, pour calculer les variables de contexte de la session courante, à savoir au moins une variable de centre d'intérêt et au moins une variable d'engagement, pour stocker dans les moyens de stockage les informations collectées par le module de collecte 320, et pour fournir les informations nécessaires au module de mise à disposition de contenus 150.
La base de données d'historiques de sessions 350 est couplée à un module profileur de session 360 permettant de classifier la base de données historiques de sessions 350, par élaboration d'au moins une variable de centre d'intérêt, et d'au moins une variable d'engagement pour chaque session stockée.
Le module de classification itératif 330 est configuré pour transmettre au module de mise à disposition de contenus 150, au moins une information de contexte qualifié par un centre d'intérêt de l'utilisateur, déterminé(s) en fonction :
· du contenu des pages vues au cours d'une session de navigation établie au moyen du module de navigation 110 ; et/ou,
• d'une sélection, au moyen d'une méthode sémantique ou d'apprentissage par machine, des termes les plus significatifs caractérisant sa requête de recherche de contenu, que ce soient des mots-clés utilisés ou des contenus sélectionnés par l'utilisateur pour formuler sa requête, au moyen du module de navigation 110, destinée à un module de recherche du module serveur de contenu 120.
La base de données d'historiques de sessions 350, couplée à un module profileur de session 360, permet de stocker un ensemble historique de données de sessions antérieures, lesdites données de sessions étant typiquement préalablement obtenues à partir d'une pluralité de données anonymes collectées lors de sessions, sur le même site web pour de nombreux utilisateurs. Le module profileur de session 360 est, en outre, configuré pour permettre de déterminer une signature pour chaque session de l'ensemble historique de données de sessions antérieures, par élaboration d'au moins une variable de centre d'intérêt et d'au moins une variable d'engagement, pour permettre ainsi de classifier entre elles les sessions par degré de similitude (méthode dite de « Clustering » en anglais).
On se réfère à la figure 2, sur laquelle sont représentées, selon un mode de réalisation de l'invention, les étapes d'un procédé de prédiction du comportement de l'utilisateur. La prédiction du comportement de l'utilisateur est exprimée en fonction des centres d'intérêt de l'utilisateur et de l'engagement de l'utilisateur vis-à-vis d'un contenu. Le contenu est, par exemple, une ou plusieurs pages web accessibles en local, des contenus de tiers insérés dans la page de contenu, des messages à caractère publicitaire. Le contenu recommandé, pour sa part, est typiquement généré par le module de mise à disposition de contenus 150, à partir d'une des sources de données 162, 164 d'un éditeur tiers ou d'un annonceur, désirant cibler le contexte courant de l'utilisateur, mais aussi plus finement son centre d'intérêt réel. Le procédé de prédiction de l'intérêt de l'utilisateur est adapté pour proposer un contenu personnalisé à l'utilisateur en analysant :
• le centre d'intérêt de l'utilisateur qualifiant le contexte, en fonction :
du contenu classifié et caractérisé du contenu visualisé, par exemple des pages vues d'un site web, au cours d'une session de navigation établie au moyen du module de navigation 110 ; et/ou
d'une sélection, au moyen d'une méthode sémantique, ou d'apprentissage et de profilage par « Machine Learning » des termes les plus importants parmi des termes utilisés par l'utilisateur au cours de sa session pour formuler, au moyen du module de navigation 110, une requête de recherche de contenu, destinée à un module de recherche du module serveur de contenu 120 ;
• l'engagement de l'utilisateur, de manière comportementale, en fonction des interactions sur les pages transmises par le module serveur de contenu 120 au module de navigation 110. L'engagement, de nature comportementale, avec un contenu et en particulier l'engagement publicitaire ou engagement face à la publicité désigne le fait d'être réceptif à un contenu et d'interagir avec un contenu ou un élément publicitaire. Le fait de lire un article jusqu'à sa partie basse nécessitant de le dérouler, ou le fait de regarder une vidéo jusqu'à sa fin, sont des exemples d'engagement de l'utilisateur vis- à-vis du contenu. Dans le domaine de la publicité sur internet, l'engagement publicitaire est souvent le fait pour un internaute d'interagir avec un élément publicitaire au-delà et autrement que par le clic. La notion d'engagement est surtout utilisée pour les formats dits « rich média » en anglais, et constitue un indicateur d'efficacité complémentaire aux taux de clics et aux indicateurs après-visualisation (ou "post-view" en anglais). L'engagement peut par exemple se traduire par le fait de :
• provoquer l'extension d'une bannière extensible ;
• d'activer la lecture ou la relecture d'une vidéo publicitaire ;
• de jouer au sein d'un bandeau ;
· de faire rejouer une création dite « rich média » ;
• de marquer par une mention « J'aime » un contenu ou une publicité.
Le fait de considérer une interaction comme un engagement est parfois abusif, car un survol de la souris peut être totalement involontaire. De ce fait, la mesure de l'engagement est meilleure lorsque celle-ci est basée sur plusieurs actes d'engagement, ou peut être dérivée d'actions itératives. L'engagement peut se mesurer par un ou plusieurs taux d'engagement de natures différentes, liés par exemple à des interactions relatives à du texte, à des images, et/ou à des vidéos. Le procédé de prédiction du comportement de l'utilisateur comporte une étape 210 de collecte, au cours d'une session courante, d'informations relatives à de nouvelles interactions de l'utilisateur, au moyen du module de navigation 110, avec des pages fournies par le module serveur de contenu 120. Avantageusement, l'étape 210 est exécutée périodiquement, ou après détection d'une nouvelle interaction de l'utilisateur sur un contenu ou une page web fournies par le module serveur de contenu 120 au module de navigation 110. Les informations relatives aux nouvelles interactions sont collectées pour un seul et même site internet, et sont relatives par exemple au contenu des pages regardées, aux mots-clés saisis par l'utilisateur, aux actions et/ou saisies de l'utilisateur pour effectuer une recherche et/ou accéder à de nouvelles informations au sein du même site — liens, filtres, recherche par image, etc. La collecte d'informations porte ainsi exclusivement sur les données accessibles pendant la session courante de l'utilisateur : aucune information relative à un historique de navigation de l'utilisateur sur internet n'est collectée. En outre, les témoins de connexion ne sont pas utilisés pour identifier l'utilisateur.
Le procédé de prédiction du comportement de l'utilisateur comporte une étape 220 d'accès, au cours d'une session courante, à des informations relatives à des interactions de l'utilisateur, au moyen du module de navigation 110, avec des pages fournies par le module serveur de contenu 120. Typiquement, il s'agit d'informations relatives aux contenus visualisés et aux interactions que l'utilisateur a engendrées, préalablement, au cours de la session courante, mise à jour jusqu'à sa dernière interaction. Les informations relatives à des interactions sont obtenues pour un seul et même site internet, et sont relatives par exemple au contenu des pages regardées, aux mots-clés saisis par l'utilisateur, aux actions et/ou saisies de l'utilisateur pour effectuer une recherche et/ou accéder à de nouvelles informations au sein du même site — liens, filtres, recherche par image, etc. La collecte d'information porte ainsi seulement sur les données accessibles pendant la session courante de l'utilisateur : aucune information relative à un historique de navigation de l'utilisateur sur internet n'est collectée. En outre, les témoins de connexion ne sont pas utilisés pour identifier l'utilisateur.
Le procédé de prédiction du comportement de l'utilisateur comporte une étape 230 de fusion des informations relatives aux nouvelles interactions de l'utilisateur obtenues au cours de l'étape 210, avec les informations relatives aux interactions de l'utilisateur obtenues au cours de l'étape 220, à savoir avec l'historique de sa session courante.
Le procédé de prédiction du comportement de l'utilisateur comporte une étape 240 de détermination et d'affinage du contexte permettant de définir puis d'améliorer en précision les centres d'intérêt de l'utilisateur, à partir des données fusionnées au cours de l'étape 230. À l'issue de l'étape 240, au moins un contexte et/ou un centre d'intérêt de l'utilisateur est/sont déterminé(s) et/ou affiné(s), en combinant :
· le contenu des pages vues au cours de la session courante de navigation établie au moyen du module de navigation 110 ; et/ou
• une sélection, au moyen d'une méthode sémantique, des termes les plus significatifs associés, ou équivalents aux requêtes de recherche de contenu de l'utilisateur, quelle que soit la nature de sa requête, pouvant combiner des mots, des actions sur le contenu, des images, des vidéos, au moyen du module de navigation 110, destinée à un module de recherche du module serveur de contenu 120.
Ainsi, outre les informations relatives au contenu des pages consultées par l'utilisateur (et les métadonnées non visibles pouvant y être associées), aux mots-clés saisis par l'utilisateur, aux images et/ou vidéos ayant servis par l'utilisateur pour formuler une ou plusieurs requêtes de recherche successives, le/les centre(s) d'intérêt de l'utilisateur est/sont déterminé(s), au cours de l'étape 240, en fonction d'une ou plusieurs ontologies ou thésaurus de référence relatifs à une pluralité de concepts illustrant des centres d'intérêts divers et variés.
De façon similaire, le procédé de prédiction du comportement de l'utilisateur comporte une étape 250 de détermination et d'affinage de l'engagement de l'utilisateur, en fonction des données comportementales fusionnées au cours de l'étape 230. Plus particulièrement, à l'issue de l'étape 250, au moins une mesure de l'engagement de l'utilisateur est déterminée et/ou affinée, en fonction des interactions de nature comportementale sur les pages transmises par le module serveur de contenu 120 au module de navigation 110, obtenues à partir des données fusionnées au cours de l'étape 230.
Le comportement d'un utilisateur explorant un contenu sur un site web, ou fourni à travers une application, est caractérisé par l'ensemble des interactions de l'utilisateur avec l'interface homme-machine. Le comportement est élaboré à partir de l'ensemble des événements reflétant toutes les actions humaines positionnées sur un axe temps. A titre d'exemples non limitatifs il peut s'agir des événements suivants :
• tous types de Clic sur une page, un bouton, un contenu,...
• déroulement d'une page, lancement d'une vidéo et durée de visualisation,... · écriture de mots dans une barre de recherche, glisser-déposer de contenu,...
• toutes actions sur le clavier, un écran tactile, et plus généralement toutes interactions avec l'interface utilisateur.
Des variables de comportements en seront déduites, telles que, mais pas limitées à :
• temps entre deux actions de l'utilisateur ;
· nombre de pages vues, temps de visionnage d'une page ;
• nombres d'images vues, et temps moyen par image ;
• nombre de vidéos vues, temps et pourcentage de visionnage des vidéos ;
• nombres d'actions selon le type de contenu : texte, image, vidéo. Le procédé de prédiction de l'engagement de l'utilisateur comporte une étape 260 de caractérisation du « centre d'Intérêt » et de « l'engagement » de l'utilisateur, en fonction des variables de centre d'intérêt de l'utilisateur déterminées au cours de l'étape 240 et des variables d'engagement de l'utilisateur déterminées au cours de l'étape 250.
À l'issue de l'étape 260, un degré d'intention de l'utilisateur est obtenu. La caractérisation de la session courante de l'utilisateur est obtenue en :
• déterminant une signature de la session courante, en fonction du contexte et/ou du centre d'intérêt de l'utilisateur déterminé au cours de l'étape 240 et de la mesure de l'engagement de l'utilisateur déterminée au cours de l'étape 250 ;
• obtenant un ensemble historique de données de sessions antérieures, lesdites données de sessions étant typiquement préalablement obtenues à partir d'une pluralité de données anonymes collectées lors de sessions, sur une pluralité de sites web, de nombreux utilisateurs ;
• déterminant, parmi l'ensemble historique de données de sessions antérieures, les sessions antérieures ayant des signatures présentant la plus grande proximité avec la signature de la session courante ;
• déterminant, à partir d'un modèle de classification, les caractéristiques de la session courante de l'utilisateur, en fonction de caractéristiques associées à un cluster de sessions antérieures ayant les signatures présentant les plus grandes proximités avec la signature de la session courante.
Ainsi, il est possible d'analyser l'activité courante de l'utilisateur et de la comparer en regard de l'activité de précédents utilisateurs ayant accédé aux mêmes types d'information sur le même site internet, à partir de sessions précédemment enregistrées et anonymisées. Des techniques dites de « Machine Learning » peuvent en particulier être utilisées pour classer le centre d'intérêt et l'engagement de l'utilisateur par rapport à une multitude de groupes de sessions, afin de proposer aux annonceurs et aux éditeurs l'achat d'encarts publicitaires ou de contenus sponsorisés dans lesquels ils proposeront des contenus personnalisés les plus proches du centre d'intérêt de l'utilisateur et en connaissant à l'avance son degré d'engagement actuel avec le contenu présenté.
Le procédé de prédiction du comportement de l'utilisateur comporte une étape 270 de sélection d'un contenu personnalisé parmi un ensemble de contenu, en fonction du centre d'intérêt et du degré d'engagement déterminés au cours de l'étape 260, puis est transmis au module de navigation 110 pour affichage.

Claims

REVENDICATIONS
1. Procédé de diffusion d'un contenu personnalisé dans un réseau de communication, à un module de navigation (110), au cours d'une session établie entre le module de navigation et un module serveur de contenu (120), dite session courante, le procédé étant caractérisé en ce qu'il comporte les étapes suivantes :
• une première étape (210, 220, 230) de collecte d'informations relatives à au moins une interaction d'un utilisateur, au moyen du module de navigation (110), avec au moins une page de contenu élaborée au moins partiellement à partir de données transmises par le module serveur de contenu (120) ;
• une deuxième étape (240) de détermination d'au moins une variable de contexte relative à au moins un centre d'intérêt de l'utilisateur, en fonction des informations relatives à ladite au moins une interaction d'un utilisateur collectées au cours de la première étape ;
· une troisième étape (250) de détermination d'au moins une variable d'engagement de l'utilisateur avec ladite au moins une page de contenu, en fonction des informations relatives à ladite au moins une interaction d'un utilisateur collectées au cours de la première étape ;
• une quatrième étape (260) de caractérisation de la session courante, en fonction d'un ensemble historique de données de sessions antérieures anonymisées ;
du contexte en fonction de ladite au moins une variable de contexte relative à au moins un centre d'intérêt de l'utilisateur ; et de ladite au moins une mesure de l'engagement de l'utilisateur ou d'au moins une mesure du degré d'intérêt de l'utilisateur, en fonction de ladite au moins une variable d'engagement déterminée au cours la troisième étape ;
• une cinquième étape (270) de diffusion d'un contenu personnalisé au module de navigation (110), en fonction de la caractérisation du contexte et de la caractérisation de ladite au moins une mesure du degré d'engagement ou ladite au moins une mesure du degré d'intérêt, déterminés au cours de la quatrième étape.
2. Procédé selon la revendication 1, dans lequel, au cours de la cinquième étape (270), le contenu personnalisé pour l'utilisateur est déterminé et/ou sélectionné par un module de mise à disposition de contenus (150), en fonction de la caractérisation du contexte et de la caractérisation de ladite au moins une mesure du degré d'engagement ou ladite au moins une mesure du degré d'intérêt, déterminés au cours de la quatrième étape.
3. Procédé selon l'une quelconque des revendications précédentes, dans lequel la première étape est exécutée périodiquement, ou après détection d'une nouvelle interaction de l'utilisateur sur une page de contenu transmise par le module serveur de contenu.
4. Procédé selon l'une quelconque des revendications précédentes, dans lequel ladite au moins une interaction de l'utilisateur avec ladite au moins une page de contenu transmise par le module serveur de contenu est relative à l'une ou à une combinaison d'interactions parmi la liste suivante : consultation d'une page de contenu/web, consultation d'une sous-section d'une page web via un lien ou un menu, saisie d'un mot-clé, expression d'un intérêt ou un non-intérêt pour un document multimédia, action et/ou saisie de l'utilisateur pour effectuer une recherche de contenus, action de navigation et/ou saisie de l'utilisateur pour accéder à de nouvelles informations au sein du serveur de contenu, ou du site web.
5. Procédé selon l'une quelconque des revendications précédentes, dans lequel, au cours de la deuxième étape (240), ladite au moins une variable de contexte est déterminée, en fonction du contenu de ladite au moins une page de contenu et/ou d'informations non visibles par l'utilisateur attachées audit contenu.
6. Procédé selon l'une quelconque des revendications précédentes, dans lequel, au cours de la deuxième étape (240), ladite au moins une variable de contexte est déterminée, en fonction d'une sélection et/ou d'une combinaison, en entrée, de critères, et/ou d'actions, et/ou d'objets utilisés par l'utilisateur pour formuler, au moyen du module de navigation (110), une requête de contenu personnalisé, destinée à un module de recherche associé au module serveur de contenu (120).
7. Procédé selon la revendication 6, dans lequel, au cours de la deuxième étape (240), ladite au moins une variable de contexte est déterminée, en fonction d'une sélection et/ou d'une combinaison, en entrée, d'au moins une information textuelle et/ou au moins un objet multimédia, pour formuler la requête de contenu personnalisé, destinée au module de recherche associé au module serveur de contenu (120).
8. Procédé selon l'une quelconque des revendications précédentes, dans lequel, au cours de la deuxième étape (240), ladite au moins une variable de contexte est déterminée, en fonction du contenu de ladite au moins une page de contenu transmise au module de navigation, et en fonction d'au moins une ontologie de référence relative à une pluralité de concepts.
9. Procédé selon l'une quelconque des revendications précédentes, dans lequel l'ensemble historique de données de sessions antérieures comporte des données anonymes collectées lors de sessions d'utilisateurs, établies entre des modules tiers de navigation et le module serveur de contenu.
10. Procédé selon l'une quelconque des revendications précédentes, dans lequel, au cours de la quatrième étape, la caractérisation du contexte est déterminée en :
· élaborant une signature de la session, en fonction de ladite au moins une variable de contexte ;
• comparant la signature de la session courante avec l'ensemble historique de données de sessions antérieures anonymisées d'utilisateurs, pour déterminer des sessions historisées antérieures ayant une signature présentant la plus grande proximité avec la signature de la session ;
• utilisant un modèle de classification, pour déterminer les caractéristiques de la session courante de l'utilisateur, en fonction de caractéristiques associées aux sessions historisées antérieures ayant la signature présentant la plus grande proximité, en termes de classification, avec la signature de la session courante.
11. Procédé selon la revendication 2 et l'une quelconque des revendications 3 à 10 dans lequel au cours de la cinquième étape (270), le contenu personnalisé est :
• sélectionné, parmi un ensemble de contenus, en fonction de la caractérisation du contexte et de la caractérisation de ladite au moins une mesure du degré d'engagement ou ladite au moins une mesure du degré d'intérêt ;
• transmis au module de navigation (110) ;
• affiché par le module de navigation.
12. Programme d'ordinateur comportant des instructions pour l'exécution des étapes d'un des procédés selon l'une quelconque des revendications 1 à 11, lorsque ledit programme est exécuté par un processeur.
13. Support d'enregistrement lisible par un ordinateur sur lequel est enregistré un programme d'ordinateur comprenant des instructions pour l'exécution des étapes des procédés selon l'une quelconque des revendications 1 à 11.
14. Module adapté pour diffuser un contenu personnalisé dans un réseau de communication, à un module de navigation (110), au cours d'une session établie entre le module de navigation et un module serveur de contenu (120), caractérisé en ce qu'il comporte :
• un module configuré pour collecter des informations relatives à au moins une interaction d'un utilisateur, au moyen du module de navigation, avec au moins une page de contenu élaborée au moins partiellement à partir de données transmises par le module serveur de contenu ;
• un module configuré pour déterminer au moins une variable de contexte relative à au moins un centre d'intérêt de l'utilisateur, en fonction des informations relatives à ladite au moins une interaction d'un utilisateur ;
• un module configuré pour déterminer au moins une variable d'engagement de l'utilisateur avec ladite au moins une page de contenu, en fonction des informations relatives à ladite au moins une interaction d'un utilisateur ;
• un module configuré pour déterminer, en fonction d'un ensemble historique de données de sessions antérieures anonymisées :
o une caractérisation du contexte en fonction de ladite au moins une variable de contexte relative à au moins un centre d'intérêt de l'utilisateur ; et
o une caractérisation de ladite au moins une mesure de l'engagement de l'utilisateur ou d'au moins une mesure du degré d'intérêt de l'utilisateur, en fonction de ladite au moins une variable d'engagement ;
• un module configuré pour diffuser, au module de navigation (110), un contenu personnalisé en fonction de la caractérisation du contexte et de la caractérisation de ladite au moins une mesure du degré d'engagement ou ladite au moins une mesure du degré d'intérêt.
15. Système comportant un module de navigation (110), un module serveur de contenu (120) et un module selon la revendication 14.
EP17757809.3A 2016-08-05 2017-08-04 Moyens de diffusion d'un contenu personnalisé dans un réseau de communication Withdrawn EP3494494A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1657604A FR3054903B1 (fr) 2016-08-05 2016-08-05 Moyens de diffusion d’un contenu personnalise dans un reseau de communication
PCT/FR2017/052197 WO2018024999A1 (fr) 2016-08-05 2017-08-04 Moyens de diffusion d'un contenu personnalisé dans un réseau de communication

Publications (1)

Publication Number Publication Date
EP3494494A1 true EP3494494A1 (fr) 2019-06-12

Family

ID=57680345

Family Applications (1)

Application Number Title Priority Date Filing Date
EP17757809.3A Withdrawn EP3494494A1 (fr) 2016-08-05 2017-08-04 Moyens de diffusion d'un contenu personnalisé dans un réseau de communication

Country Status (8)

Country Link
US (1) US20210049647A1 (fr)
EP (1) EP3494494A1 (fr)
JP (1) JP2019527906A (fr)
KR (1) KR20190049722A (fr)
CN (1) CN110199275A (fr)
EA (1) EA201990461A1 (fr)
FR (1) FR3054903B1 (fr)
WO (1) WO2018024999A1 (fr)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020071402A1 (fr) * 2018-10-02 2020-04-09 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ Procédé de fourniture d'informations
US11675858B2 (en) * 2019-06-26 2023-06-13 Primer Technologies, Inc. Enhanced content format management for web services
CN111818370B (zh) * 2020-06-30 2022-03-11 腾讯科技(深圳)有限公司 信息推荐方法、装置、电子设备及计算机可读存储介质
FR3143816A1 (fr) * 2022-12-14 2024-06-21 Orange Procédé de gestion de la consultation d’un contenu numérique

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2936331A1 (fr) * 2008-09-23 2010-03-26 Jeremy Deplasse Portail informatique avec modification automatique d'affichage
FR2997254B1 (fr) * 2012-10-18 2015-11-27 Tellmeplus Procede et dispositif de diffusion d'information a un utilisateur muni d'un terminal portable communiquant
FR3006472B1 (fr) 2013-05-31 2016-12-30 Xilopix Procede de recherche dans une base de donnees

Also Published As

Publication number Publication date
KR20190049722A (ko) 2019-05-09
WO2018024999A1 (fr) 2018-02-08
EA201990461A1 (ru) 2019-08-30
FR3054903B1 (fr) 2020-01-03
CN110199275A (zh) 2019-09-03
FR3054903A1 (fr) 2018-02-09
JP2019527906A (ja) 2019-10-03
US20210049647A1 (en) 2021-02-18

Similar Documents

Publication Publication Date Title
US10796093B2 (en) Automatic generation of statement-response sets from conversational text using natural language processing
US20220122097A1 (en) Method and system for providing business intelligence based on user behavior
JP6827515B2 (ja) ビデオ検索に対する視聴時間クラスタリング
US9442984B2 (en) Social media contributor weight
US8676875B1 (en) Social media measurement
US20170286539A1 (en) User profile stitching
TWI636416B (zh) 內容個人化之多相排序方法和系統
US9420319B1 (en) Recommendation and purchase options for recommemded products based on associations between a user and consumed digital content
US20140129324A1 (en) System and method for dynamically placing and scheduling of promotional items or content based on momentum of activities of a targeted audience in a network environment
US20080077568A1 (en) Talent identification system and method
US20120130805A1 (en) Selecting media advertisements for presentation based on their predicted playtimes
US20110264531A1 (en) Watching a user's online world
US20080005313A1 (en) Using offline activity to enhance online searching
US10528987B2 (en) Systems and methods for providing real-time marketing campaigns
US20100211863A1 (en) Action-based pre-population of user profiles
CN102541981A (zh) 追踪在线社交行为来增强搜索体验
US20110246277A1 (en) Multi-factor promotional offer suggestion
EP3494494A1 (fr) Moyens de diffusion d'un contenu personnalisé dans un réseau de communication
KR102141245B1 (ko) 콘텐츠 창작자와 후원자 매칭을 통한 온라인 콘텐츠 투자 시스템 및 방법
WO2015110845A1 (fr) Campagnes auto-créées pour des mots-clés de mot-dièse
RU2683482C2 (ru) Метод отображения релевантной контекстно-зависимой информации
JP2020057221A (ja) 情報処理方法、情報処理装置及びプログラム
US20110264525A1 (en) Searching a user's online world
US20190278461A1 (en) Recommendation acknowledgement and tracking
Alabduljabbar et al. Context-Aware News Recommendation System: Incorporating Contextual Information and Collaborative Filtering Techniques

Legal Events

Date Code Title Description
STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: UNKNOWN

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE INTERNATIONAL PUBLICATION HAS BEEN MADE

PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: REQUEST FOR EXAMINATION WAS MADE

17P Request for examination filed

Effective date: 20190304

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

AX Request for extension of the european patent

Extension state: BA ME

DAV Request for validation of the european patent (deleted)
DAX Request for extension of the european patent (deleted)
STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: EXAMINATION IS IN PROGRESS

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: EXAMINATION IS IN PROGRESS

17Q First examination report despatched

Effective date: 20210720

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20211201