WO2018115626A1 - Identification of an information source - Google Patents

Identification of an information source Download PDF

Info

Publication number
WO2018115626A1
WO2018115626A1 PCT/FR2017/053433 FR2017053433W WO2018115626A1 WO 2018115626 A1 WO2018115626 A1 WO 2018115626A1 FR 2017053433 W FR2017053433 W FR 2017053433W WO 2018115626 A1 WO2018115626 A1 WO 2018115626A1
Authority
WO
WIPO (PCT)
Prior art keywords
source
content
produced
events
query
Prior art date
Application number
PCT/FR2017/053433
Other languages
French (fr)
Inventor
Jérôme BESOMBES
Original Assignee
Office National D'etudes Et De Recherches Aérospatiales
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Office National D'etudes Et De Recherches Aérospatiales filed Critical Office National D'etudes Et De Recherches Aérospatiales
Publication of WO2018115626A1 publication Critical patent/WO2018115626A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Definitions

  • the present invention relates to a method of identifying an information source, as well as an automatic search module and a program that are adapted to implement such a method.
  • information is considered all the more relevant as its subject corresponds with more coincidence to the area of interest as determined by the user.
  • known systems of documentary surveillance can classify in descending order of the contents that pre-exist in the database interrogated, or those which were added during a certain period, then to submit this classification to the 'user.
  • the system integrates uses of other users who are judged to have common interests with the current user, for example because they belong to the same social network. It is then possible to modify the domain of interest of the current user, according to domains of interest of other users; and
  • automatic learning the system changes the domain of interest that was initially characterized by the user, for example as a function of interrogations which were successively produced by the user, according to privileged consultations, by the user. user, content that relates to certain topics, or based on user-generated ratings of content previously presented to him / her.
  • the source of it can be communicated to the user, such as for example a Twitter account, a media or blog website, etc. It is then possible for the user to "follow" these sources by systematically or selectively consulting the content they produce. These sources may also produce content outside the domain of interest entered by the user, which can help to change this area of interest. Thus, a source that has shown an important ability to produce useful content for a particular area of interest can also produce content that is relevant to the user outside of that particular area or boundary thereof. Such identification of sources is already widely practiced in the context of social network analysis. It is then mainly to identify people who are at the heart of the network, called opinion leaders.
  • an object of the present invention is to provide a user with easy access to a source of content that is the source of early information on events, especially if this source has a small audience or appears with a low level of occurrence in the databases.
  • clairvoyant source Such an early source of information is referred to herein as the clairvoyant source, regardless of its audience and level of influence on other sources.
  • a clairvoyant source with a low audience level will be called a "weak source”.
  • An ancillary object of the present invention is to identify clairvoyant sources for areas of interest that are likely to evolve, either because of the user or because of external trends that affect the community of sources of interest. content.
  • a first aspect of the present invention provides a method of identifying an information source, which comprises the following steps to be performed using an automatic search module:
  • 121 collect from at least one database, content references that are obtained in response to the query query, and whose contents each correspond to at least one of the events, and for each content, identify a source and a date of production of this content.
  • the term "at least one interrogation request” is understood to mean a set of interrogation requests, which may contain one or more interrogation requests, which are implemented during the same execution of the interrogation request. method of the invention.
  • the method further comprises the following additional steps: 131 among the identified sources, selecting at least one source that has produced at least one content relating to at least one of the events of step IM;
  • IAI for each source selected in step 131, and for each content produced by this source that is relative to one of the events of step IM, determining a temporal advance acquired by the source having produced this content, relative to on a date of the event or by report at a date when other contents relating to the same event have been produced, then combining the temporal clearances acquired by one of the sources selected in step 131 in order to calculate a numerical value, called the anticipation value and attributed to the source, which varies monotonously according to each temporal advance determined for this source; then
  • step 131 it is possible to select a source only if it has produced contents that are related to several of the events of the step / M.
  • the method of the invention implements a correlation between subsets of contents that have been obtained in response to the interrogation request, and which relate to different events. Correlation identifies sources that have been active for multiple events, minimizing the importance of sources that have been active for only one event. In this way, the sources that appeared in the responses while they correspond little to the events of the interrogation request, are discarded. All content considered in step IAI may correspond to references that were collected at step 121.
  • the method of the invention classifies the sources that have been active about several of the events, based on their cumulative anticipation with respect to each event, or with respect to other sources about the events involved.
  • a source that has reacted in advance of others to several events or has anticipated several events more than the other sources that is to say, a source that has been clairvoyant, is evidenced by the method of the invention, and its identification is provided to a document surveillance operator.
  • said at least one query request is constructed directly from an initial supply of several events.
  • the events are fixed and known a priori by the document surveillance operator who applies the invention.
  • said at least one query request is generated in step IM from an event capture in the automatic search module, and each time advance that is acquired by a source can be determined at the same time.
  • step 141 as a difference between the date of one of the events and a date when the source has produced content relating to the same event, and whose reference was collected at step 121.
  • the events may not be known a priori, but are underlying in the responses that are obtained to said at least one query request.
  • the respective dates of these events are not known, but dates that are produced simultaneously or in a short time many contents that correspond to said at least one query query, are approximations of these dates of events. These approximations can then be used to evaluate the temporal advance of each content.
  • the step IM of such second embodiments of the invention then comprises entering a characterization of a field of interest in the automatic search module.
  • the query query is then determined from the domain of interest entered, in a manner that is known per se.
  • step 121 after collecting the content references that were obtained in response to the query request, dates are determined, at which larger numbers of these contents have been generated.
  • each of these dates is then associated with one of the events of the step IM, even if this event may remain unknown. Then, each time advance that is acquired by a source can be determined in step 141 as a difference between one of the dates at which a greater number of contents were generated whose references were collected at step 121, and a date on which the source has produced content whose reference was also collected at step 121.
  • events can be known a priori, to which can be added other events which are detected as in step IM of the second modes of the invention. Implementation.
  • the anticipation value which is calculated for each source selected in step 131 may be an increasing function of each time advance that has been acquired by this source having produced a content relating to the one of the events. In this way, a clairvoyant source is characterized by a high anticipation value.
  • the steps IAI and 151 can be executed for several sources that were selected in step 131, and their identifiers are provided in step 151 by being ranked according to the anticipation values that were calculated for each of these sources.
  • the method of the invention may include an additional step of removing sources whose hearing is too important, to highlight more clairvoyant sources low noise.
  • an audience value can be determined for each of the sources that were selected in step 131, and one of them can be rejected if its audience value is greater than a predetermined threshold value, or greater than the audience value of at least one of the sources selected at step 131.
  • the audience value of a source may include the number of third-party views of the content that was produced by that source. source.
  • the query request that is produced in step IM may be an aggregation of several elementary requests.
  • the aggregation is established according to predetermined aggregation rules, including rules of proximity or semantic or linguistic equivalence.
  • the anticipation value can be calculated for each source that has been selected in step 131, also as a function of at least one of the following parameters, in addition to the time delays acquired by this source: a number of events among all those of step IV, in relation to each of which at least one content has been produced by the source whose anticipation value is calculated;
  • step IV a number of events among all those of step IV, in relation to each of which no content has been produced by the source whose anticipation value is calculated;
  • each event can be weighted in the calculation of the anticipation value, by an importance value of this event which can be evaluated by an expert, or which can be evaluated for example according to the height and / or peak width of variations in the number of contents produced. It is also possible to penalize a source that has not reacted to one of the events, or to take into account the general reactivity to an event. Thus, the value of anticipation can even better reflect the merit of a source to cover several events and to be precursor on them.
  • the method of the invention may further comprise the following step, which is performed after step 151: / 6 / obtain at least one content that has been generated by a source whose identifier and anticipation value has been provided in step / 5 /.
  • one of the contents that has been produced by a source revealed to be clairvoyant by the method of the invention may be provided to the operator of the documentary surveillance.
  • the method of the invention including steps / M to 15 / can be executed twice, using the second implementation mode indicated above for the second execution. Then, the domain of interest whose characterization is entered in step IM of the second execution can be determined at least partially from another domain of interest which is relative to a source whose identifier and the value anticipation were provided at step 15 / of the first execution.
  • the first execution of the method of the invention makes it possible to identify a clairvoyant source, and the second execution can be focused on subjects of interest from this clairvoyant source, which may not have been covered by the request. interrogation of the first execution of the method of the invention.
  • a second aspect of the invention provides an automatic search module, which comprises:
  • collection means adapted to collect from at least one database, content references that are obtained in response to said at least one query request, and whose contents each correspond to one of the fewer events;
  • identification means adapted to identify a source and a production date for each content whose reference has been collected by the collection means; selection means adapted to select from sources identified by the identification means, at least one source which has produces at least one content relating to at least one of the events corresponding to the query request;
  • calculation means adapted to determine for each source selected by the selection means, a temporal advance acquired by this source having produced a content relating to one of the events, with respect to a date of this event or in relation to a date where other contents relating to the same event were produced, then to combine the temporal compensations acquired by one of the selected sources in order to calculate a numerical value, called anticipation value and attributed to the source, which varies monotonically in the function of each time advance determined for that source; and
  • Such an automatic search module is adapted to perform a method according to the first aspect of the invention, possibly including the improvements and embodiments mentioned for this method.
  • the selection means may be adapted to select from the sources identified by the identification means, at least one source that has produced content relating to several of the events corresponding to the query request.
  • the means for producing the query request can be adapted to allow a user to enter several events, and furthermore to produce the query of query from the events entered.
  • the calculation means can be adapted to determine each time advance, for a selected source that has produced a content relating to several of the events, as a difference between the date of one of the events and a date on which this source produced content related to the same event, and whose reference was collected by the collection means.
  • the means for producing the query request are adapted to allow a user to enter a field of interest.
  • the automatic search module then further comprises counting means adapted to count, for several dates, the contents that were produced at each of these dates, and whose references were collected by the collection module. It then determines the dates on which the largest numbers of these contents were produced. Each date that is thus determined is associated with an event that corresponds to said at least one query request.
  • the calculation means may be adapted to determine each time advance, for a source selected by the selection means, as a difference between one of the dates on which a greater number of contents whose references have been produced has been produced. collected by the collection means, and a date on which the source has produced a content whose reference has also been collected by the collection means.
  • a third aspect of the invention provides a computer program that includes codes adapted to produce an execution of a method according to the first aspect of the invention, when these codes are read and executed by at least one processor, and that this processor has access to the database.
  • a program is considered as a product as such, which is derived from the invention and which brings a new function to a computer. For this reason, it is referred to as a computer program product.
  • FIG. 1 is a timing diagram showing several sources of content
  • Figure 2a is a step diagram for first possible embodiments of the present invention
  • FIG. 2b is a temporal diagram of content production whose references have been collected, which illustrates the first modes of implementation of the invention
  • FIG. 3a is a diagram of steps for second possible embodiments of the present invention.
  • FIG. 3b is a temporal diagram of production of contents whose references have been collected, which illustrates the second modes of implementation of the invention.
  • an event is any event or manifestation that belonged to the news at a time, which is called the date of the event.
  • a date may mean a daily date, but also more generally the identification of a moment with any precision: date with time, date with number of week, with indication of month, or only with an indication of year, etc.
  • Content means any data or document, including a link to a site or site page, any information, set of information, article, image, video, message, including published via a social network, which can be obtained in response to a query request.
  • database any grouping or collection of contents that can be queried by formulating a query, and a certain number of contents may be selected to be provided to a user in response to the query request.
  • a reference refers to any type of reference that allows the user to access this content, including access references, for example a link to a content web page, bibliographic references, or combinations references of variable types. For simplicity and clarity of writing, it may in some cases confuse content collected with content whose reference has been collected.
  • source we mean any author to whom a content is attributed, or any publisher referenced for the publication of the content. A source can possibly produce several contents that are related to the same event. Possibly also, the same content can have several different sources, for example several authors who collaborated.
  • the term identifier of a source any coordinate or reference, such as for example an e-mail address, a website reference or social network, etc., which identifies the source uniquely.
  • the date of production of a content is a date that is assigned to that content in a database, to identify the incorporation of the content in this database. It is thus a date of provision of the content, for the benefit of a user of the database.
  • An automatic search module is understood to mean any functional, hardware or software entity that makes it possible to interrogate a database, and to provide in response references of contents that correspond to the query used for the interrogation.
  • Such an automatic search module may include a search engine as known to the general public, but also includes features for calculating an anticipation value for implementing the present invention. In addition, it can be enriched with additional and optional features, such as running collaborative or machine-learning processes to build query queries.
  • Sources produce content that is stored in one or more database (s), at times of production that may vary between content and / or sources.
  • This request determines the domain of interest of the user, who is the object of his search for contents. It can be developed using a characterization form of the area of interest, called generic ontology in the jargon of the skilled person.
  • the user completes fields of the generic ontology, such as a concerned product indication field, a usage indication field, model indication fields, targeted target, brand name fields. , sourcing, origin, etc.
  • the combination of these fields as completed by the user is called the business ontology and expresses the domain of interest of the user to query the database (s) of data.
  • the automatic search module then establishes a query to query the database (s) of data based on the business query.
  • This request can be established from the business ontology only, as elaborated by the user.
  • the business query and each other request are called elementary queries, and are aggregated to build the final query, called the query query with which the database (s) is (are) queried (s) .
  • Predefined aggregation rules are used for this, which are well known to those skilled in the art. Such aggregation rules translate in particular semantic or linguistic proximities or equivalences, or even binary operations on the contents of the fields of the elementary requests.
  • the business request that is established by the user can be combined with at least one other business request that has been established by another user, preferably on the condition of proximity between these users.
  • Such an interrogation method is commonly called collaborative filtering by the skilled person.
  • one of the basic requests that is combined with the business request established by the user may correspond to a characterization of a domain of interest relating to a content source that is active in particular in the field of interest of the user. 'user.
  • the business query as produced by the user can be enriched or oriented in according to that of the source, so that the field of interest of the user can follow that of the source, possibly also taking into account an evolution of the domain of interest of the source.
  • the business request of the source which is intended to form an elementary query in the aggregation with that of the user, may have been established by the source itself, for example to facilitate access to the content it has products, or automatically, including a content editing module.
  • the automatic search module may have stored business requests that were previously established by the user, and aggregate them as basic requests to build the query query. The aggregation can then result from a learning process, which extrapolates the business requests established successively by the user.
  • the business request that has been established by the user can also be combined with content that has been previously consulted by the user, and possibly taking into account the assessments of some of these contents that have been entered. by the user. In this way, the query request can anticipate an evolution of the user's field of interest.
  • Such an interrogation method is commonly called filtering by human learning of the art.
  • FIG. 1 the horizontal axis symbolically marks the time, noted t, with a chronological order from left to right of the figures.
  • SrS 4 denote sources of contents that are stored in the data base (s) BD. Such contents are indicated generically by the letter D.
  • the automatic search module is designated by the reference 1.
  • the user, or document monitoring operator, is denoted U, and the interrogation request denoted RQ.
  • the brace on the right of FIG. 1 designates those contents D of the database BD that correspond to the interrogation request RQ, excluding contents that do not correspond to this interrogation request.
  • the automatic search module 1 collects references of the contents D which correspond to the request for interrogation RQ, as well as the production dates and sources of these contents.
  • the source Si does not produce content that corresponds to the query RQ query.
  • the source S2 produces several contents that correspond to the interrogation request RQ, whose content noted D 2 at the date T (D 2 ).
  • the source S 3 produces several contents that correspond to the interrogation request RQ, whose content noted D 3 at the date T (D 3 ).
  • the source S 4 produces several contents that correspond to the interrogation request RQ, whose content noted D 4 at the date T (D 4 ).
  • the content D 2 has been produced by the source S 2 before the content D 3 produced by the source S 3 , the latter before the content D produced by the source S 4 .
  • the automatic search module 1 thus collects in particular the references, the source identifiers and the production dates of the contents D 2 , D 3 and D 4 .
  • FIGS. 2a and 2b illustrate first embodiments of the invention, in which events are initial data of the method.
  • the step STi consists of an input, for example by the user U, of a series of events that are individually designated by EV- ⁇ for a first of these events whose event date is T (EV-i ), EV 2 for a second of these events whose event date is T (EV 2 ), etc. From this series of events EV-i, EV 2 ,..., The automatic search module 1 constructs the interrogation request RQ at the step ST 2 , and implements this request to interrogate the database of BD data.
  • the result of the query is a set of contents that are denoted D ,, D j , ..., whose automatic search module 1 collects the references, the identifiers of the sources that produced these contents, and the production dates. of these contents (step ST 3 ).
  • the content D was produced by the source S (Di) at the date T (Di)
  • the content Dj was produced by the source S (Dj) at the date T (Dj), etc.
  • step ST the automatic search module 1 classifies the contents that have been collected in response to the query query RQ, depending on the sources that produced them. For example, a same source Sk has produced at least the two contents D m and D n , the content D m at the date T (D m ) and the content D n at the date T (D n ).
  • those sources that each correspond to only one reference of collected content can be removed from the rest of the process, so that are not preserved than multi-content sources. For each of these, each content that it has produced is brought closer to that of the events of the step STi to which this content relates, and a temporal advance is calculated.
  • the content D m that has been produced by the source S k concerns the event EV X
  • the temporal advance of the source S k for this content D m is T (EV X ) - T (D m )
  • T (EV X ) is the date of the event EV X
  • T (D m ) is the production date of the content D m by the source Sk.
  • the temporal advance of the source S k for this content D n is T (EV y ) - T (D n ), where T (EVy) is the date of the event EV y and T (D n ) is the production date of the content D n .
  • Sk source is selected further so that the EV EV events X and y are different from one another. All the time advances that are acquired by the source S k having produced different contents, are then combined at the step ST 5 to calculate a forward value VA (Sk) which is attributed to this source Sk.
  • VA (Sk) f ⁇ ..., T (EV X ) - T (D m ), T (EV y ) - T (D n ), ... ⁇ , where f is a combination function of all time outflows of the same source of contents.
  • the anticipation value VA (Sk) is then supplied to the user U with an identifier of the source Sk.
  • the diagram of FIG. 2b represents the variations of the number of contents that have been produced per day for the two EV events X (curve denoted x) and EV y (curve denoted y), and whose references were collected in step ST 3 .
  • the ordinate axis of this diagram thus locates these numbers of contents produced per unit of time, for example per day.
  • the curve x shows that the contents relating to the event EV X have mainly been produced late compared to the date T (EV X ) of this event. This is the case, in particular, for the content D m , since the difference of dates T (EV X ) - T (D m ), which constitutes the temporal advance, is negative. In contrast, many content related to EV event y , whose content D n , were produced before this event EV y , corresponding to anticipatory or premonitory contents. The temporal advance T (EV y ) - T (D n ) is then positive.
  • the step ST- ⁇ is executed using input means of the automatic search module 1
  • the step ST 2 is executed by means for producing interrogation requests
  • the step ST 3 is executed by content collection means in combination with means for identifying sources and dates of production of the contents
  • the steps ST 4 and ST 5 are executed by content source selection means in combination with calculation means of the automatic search module 1.
  • FIGS. 3a and 3b illustrate second embodiments of the invention, in which the events to which the collected contents refer are not known initially by the user U.
  • the ST-T step consists of an input, for example by the user U, of a domain of interest D1, for example by using a business request as described above.
  • the automatic search module 1 constructs the query RQ query from the field of interest Dl.
  • the interrogation of the database BD by the request RQ and the step ST 3 of collection of content references that correspond to the request RQ are identical to those of the implementation modes of Figure 2a.
  • the additional step ST 3 ' is illustrated by FIG. 3b, and aims to determine, with as much likelihood as possible, the dates of the events that are concerned by the contents whose references were collected at the step ST 3 .
  • This likelihood is greater when the content production dates are grouped into separate or roughly separate periods, so that the existence of a separate event can be attributed to each period.
  • the automatic search module 1 identifies maxima in the variations of the number N / j of the contents that were produced per day during a period of analysis PA, and whose references were collected at step ST 3 .
  • This is the total number of content collected per unit of time, for example per day, regardless of the event that is affected by each content.
  • the curve of the number N / d as a function of time t which is represented in the diagram of FIG. 3b may have three maxima, denoted Mi, M 2 and M 3 , corresponding to the dates T (Mi), T (M 2 ) and T (M 3 ) respectively.
  • each maximunn of the curve of N / j as a function of time was probably caused by an event covered by the interrogation request RQ
  • the maximum Mi is identified in the rest of the process to a first event that would have occurred on the date T (Mi)
  • the maximum M 2 is identified with a second event that would have occurred on the date T (M 2 )
  • the maximum M 3 is identified with a third event that would have occurred on the date T ( M 3 ).
  • each content whose reference has been collected in step ST 3 concerns that of the events thus identified which is closest to it chronologically.
  • T (RQ) designates the date on which the query query RQ is used in the database BD.
  • the date T (RQ) may be the end of the analysis period PA during which the variations of the number N / d as a function of time t are analyzed, but not necessarily.
  • the analysis period PA can possibly be stopped before the date T (RQ).
  • Step ST 4 'of FIG. 3a corresponds to step ST 4 of FIG.
  • the anticipation value VA (S 2 ) of the source S 2 depends on the positive time advance T (Mi) - T (D 2 )
  • the anticipation value VA (S 3 ) of the source S 3 depends on the negative time advance T (Mi) - T (D 3 )
  • the anticipation value VA (S 4 ) of the source S 4 depends on the positive time advance T (M 2 ) - T (D 4 ).
  • an anticipation value can be calculated only for those sources that have produced at least two contents that corresponded to the RQ request. , and which concern different maxima of the number N / d.
  • the anticipation value VA (S k ) depends on the two temporal detours T (M X ) - T (D m ) and T (M y ) - T (D n ), as indicated in steps ST 4 'and ST 5 ' of Figure 3a.
  • the function f having as variables the temporal advances of the same source, and which was used in the first embodiments of the invention (FIGS. 2a and 2b), can be used identically for the second embodiments. of the invention ( Figures 3a and
  • the step STY is executed using the input means of the automatic search module 1, the step ST 2 'is executed by the query request generation means, the step ST 3 is again executed by means of collecting content in combination with the means for identifying sources and content production dates, and the steps ST 4 'and ST 5 ' are executed by the source content selection means in combination with the means for calculating the content.
  • automatic search module 1 The step STY is executed using the input means of the automatic search module 1, the step ST 2 'is executed by the query request generation means, the step ST 3 is again executed by means of collecting content in combination with the means for identifying sources and content production dates, and the steps ST 4 'and ST 5 ' are executed by the source content selection means in combination with the means for calculating the content. automatic search module 1.
  • the function f which is used to calculate the anticipation values is an increasing function of the algebraic value of each time advance, expressed as the date of the event or a maximum of the curve of the number N / d as a function of the time t, reduced by the date of production of the content, so that a source which is more clairvoyant has a value of anticipation which is higher.
  • the function f can be such that the contribution in the anticipation value of that of the temporal advance that corresponds to the first content that has been produced by the source in relation to an event, is greater than another contribution corresponding to other content that has also been produced by the same source in relation to the same event.
  • a function f can be given for each event EV X of date T (EV X ), which is either detected by the analysis of the number of documents produced per unit of time, such that this number comes from the request RQ , provided as input to the automatic search module, and for each source S k having produced a content D n at the date T (D n ) which is relative to EV X , and thus returned in response to the request RQ.
  • a contribution VA x (Sk) to the anticipation value of the source Sk relative to the event EV X can be for example:
  • VA x (Sk) T (EV X ) - T (D n ) if T (D n ) ⁇ T (EV X ) and T (EV X ) - T (D n ) ⁇ MA
  • VA x (S k ) 0 if T (D n ) ⁇ T (EV X ) and T (EV X ) - T (D n )> MA
  • VA x (S k ) max (0, MA - (T (D ") - T (EV X ))) if T (EV X ) ⁇ T (D")
  • the function f may additionally depend on one of the following additional parameters:
  • the anticipation value VA (S k ) VA (Sk) -N + k , where VA (Sk) is as defined above;
  • the anticipation value VA (Sk) VA (Sk) / N " k , where VA (Sk) is still as defined above; for each event EV X , the number NC (EV X ) of collected content that has been produced or is supposed to have been produced, in connection with this event, regardless of whether the source S k has or has not content product related to this event.
  • VA (Sk) VA x (Sk) -NC (EV x ), where VA x (S k ) is as defined above;
  • a value of an HL X ratio of peak height over peak width which concerns the variations in the number N / j of collected contents that have been produced per unit of time, in relation to this event, independently because the source S k has or has not produced content relating to this event. It is thus possible to modulate in the anticipation value VA x (Sk), the contribution of each pair formed by one of the contents produced by the source S k with the event concerned by this content, as a function of characteristics of the reaction caused by this event for all identified sources.
  • the steps ST 4 and ST 5 , or ST 4 'and ST 5 ' can be executed separately for several different sources. Then the identifiers of these sources can be provided to the user U at the end of the process in descending order of the anticipation values that have been calculated. The most clairvoyant sources can thus be presented first to the user U.
  • clairvoyant sources that have low occurrence levels in the response that has been obtained to the query query RQ, are relegated to worse anticipation values because of other sources that have problems. higher levels of occurrence.
  • the the level of occurrence of a source, or occurrence value can be determined in particular as the number of contents it has produced and which have been collected in step ST 3 . Then, a source may optionally be excluded from the remainder of the process if its occurrence value is greater than a fixed threshold value, or is greater than a limit value that is adjusted according to the other sources of content collected.
  • the method of the invention may be executed a first time, corresponding to a first set of events, to identify the clairvoyant source, then executed a second time to correspond to a second set of events which is different from the first set of events. first, but which better corresponds to all the fields of activity of the clairvoyant source.
  • the domain of interest that is entered is advantageously developed taking into account a field of interest of the clairvoyant source.
  • the invention makes it possible to indicate to the user which sources have been active first in his field of interest.
  • the user can have direct access to precursor content. Access to such precursor contents can then be provided to the user by specific or priority means, for example by means of alerts, so that the user is aware of the existence of these precursor content even if they present a signal that is still weak for conventional search engines.
  • the invention thus makes it possible to favor the speed of access to new information compared to information that is already widely available. Indeed, a really new information, or precursory information, has not yet had time to be repeated, taken back and / or reused by secondary sources of content other than the initial source of the precursor information.

Abstract

The identification of an information source (S2-S4) that has produced content (D2-D4) accessible by at least one database (BD) allows a level of anticipation of said source to be known in relation to other sources that have subsequently produced other content. A subsequent monitoring of a source that has shown a high level of anticipation can allow new information to be accessed before said information has been largely repeated, regained or reused.

Description

IDENTIFICATION D'UNE SOURCE D'INFORMATION  IDENTIFICATION OF AN INFORMATION SOURCE
La présente invention concerne un procédé d'identification d'une source d'information, ainsi qu'un module de recherche automatique et un programme qui sont adaptés pour mettre en œuvre un tel procédé. The present invention relates to a method of identifying an information source, as well as an automatic search module and a program that are adapted to implement such a method.
La mise à disposition de bases documentaires qui sont de plus en plus étendues, contenant notamment des informations, des articles, des images, des vidéos, des messages publiés via des réseaux sociaux, etc., et qui permettent à des auteurs de produire de nouveaux contenus avec une fréquence de plus en plus élevée, rend une tâche de surveillance documentaire de plus en plus complexe. Des systèmes automatisés de surveillance documentaire permettent de rechercher des contenus qui sont liés à un domaine d'intérêt déterminé par un utilisateur, puis de présenter à cet utilisateur les contenus collectés qui sont supposés lui être les plus utiles. L'utilité de ces contenus est couramment évaluée selon les deux critères suivants : The provision of documentary databases that are increasingly extensive, including information, articles, images, videos, messages published via social networks, etc., and which allow authors to produce new contents with a frequency of higher and higher, makes a task of documentary surveillance more and more complex. Automated document monitoring systems are used to search for content that is related to a domain of interest determined by a user, and then to present to that user the collected content that is supposed to be most useful to them. The usefulness of these contents is currently evaluated according to the following two criteria:
- l'ancienneté de l'information : une information est considérée d'autant plus pertinente que sa parution est récente ; et - the age of the information: information is considered all the more relevant because its publication is recent; and
- la pertinence de l'information : une information est considérée d'autant plus pertinente que son sujet correspond avec plus de coïncidence au domaine d'intérêt tel que déterminé par l'utilisateur. - the relevance of the information: information is considered all the more relevant as its subject corresponds with more coincidence to the area of interest as determined by the user.
A partir de ces deux critères, des systèmes connus de surveillance documentaire peuvent classer par ordre d'utilité décroissante les contenus qui préexistent dans la base de données interrogée, ou ceux qui ont été ajoutés pendant une certaine période, puis de soumettre ce classement à l'utilisateur. From these two criteria, known systems of documentary surveillance can classify in descending order of the contents that pre-exist in the database interrogated, or those which were added during a certain period, then to submit this classification to the 'user.
Toutefois, la pertinence des résultats de telles recherches dépend beaucoup de la capacité du système utilisé à intégrer le domaine d'intérêt de l'utilisateur. Or deux difficultés limitent cette capacité : However, the relevance of the results of such searches depends very much on the ability of the system used to integrate the user's area of interest. But two difficulties limit this capacity:
- la difficulté de modélisation du domaine d'intérêt : c'est-à-dire la manière dont ce domaine peut être exprimé, par exemple par mots-clés, et peut être intégré au système ; et the difficulty of modeling the domain of interest: that is to say the way this domain can be expressed, for example by keywords, and can be integrated into the system; and
- la difficulté de prise en compte d'une évolution possible du domaine d'intérêt de l'utilisateur au cours du temps. the difficulty of taking into account a possible evolution of the domain of interest of the user over time.
Pour répondre à ces difficultés, différentes techniques ont été développées et sont mises en œuvre : To answer these difficulties, different techniques have been developed and implemented:
- le filtrage collaboratif : le système intègre des usages d'autres utilisateurs qui sont jugés comme ayant des intérêts communs avec l'utilisateur en cours, par exemple parce qu'ils appartiennent à un même réseau social. Il est alors possible de modifier le domaine d'intérêt de l'utilisateur en cours, en fonction de domaines d'intérêt d'autres utilisateurs ; et - Collaborative filtering: the system integrates uses of other users who are judged to have common interests with the current user, for example because they belong to the same social network. It is then possible to modify the domain of interest of the current user, according to domains of interest of other users; and
- l'apprentissage automatique : le système fait évoluer le domaine d'intérêt qui a été caractérisé initialement par l'utilisateur, par exemple en fonction d'interrogations qui ont été produites successivement par l'utilisateur, en fonction de consultations privilégiées, par l'utilisateur, de contenus qui concernent certains sujets, ou en fonction d'évaluations produites par l'utilisateur au sujet de contenus qui lui ont été présentés antérieurement. automatic learning: the system changes the domain of interest that was initially characterized by the user, for example as a function of interrogations which were successively produced by the user, according to privileged consultations, by the user. user, content that relates to certain topics, or based on user-generated ratings of content previously presented to him / her.
Ces deux techniques peuvent être utilisées séparément ou en combinaison l'une avec l'autre. These two techniques can be used separately or in combination with each other.
Mais le filtrage collaboratif n'est possible que si l'utilisateur accepte de partager ses usages avec une communauté, ce qui est peu compatible avec des surveillances documentaires qui s'inscrivent dans un cadre concurrentiel ou un cadre sécuritaire. Par ailleurs, l'apprentissage automatique implique souvent une certaine inertie, qui ne permet pas de faire évoluer rapidement, lorsque cela peut être nécessaire, les caractéristiques de domaines d'intérêt qui sont issues des usages antérieurs. En outre, ces caractéristiques concernant les usages antérieurs, qui sont issues de l'analyse des usages de l'utilisateur, sont souvent faibles en qualité et quantité. Pour améliorer encore la pertinence des contenus qui sont fournis à l'utilisateur en réponse à une requête d'interrogation établie d'après un domaine d'intérêt qu'il a saisi, il est aussi connu d'identifier des sources des contenus utiles qui ont déjà été fournis à cet utilisateur. Ainsi, en plus de chaque contenu, la source de celui-ci peut être communiquée à l'utilisateur, telle que par exemple un compte Twitter, un site web de média ou de blog, etc. II est alors possible pour l'utilisateur de «suivre» ces sources en consultant systématiquement ou de manière sélective les contenus qu'elles produisent. Ces sources peuvent éventuellement aussi produire des contenus en dehors du domaine d'intérêt saisi par l'utilisateur, ce qui peut permettre de faire évoluer ce domaine d'intérêt. Ainsi, une source qui a montré une capacité importante à produire des contenus utiles pour un domaine d'intérêt particulier, peut produire également des contenus qui sont pertinents pour l'utilisateur en dehors de ce domaine particulier ou en frontière de celui-ci. Une telle identification de sources est déjà largement pratiquée dans le cadre de l'analyse de réseaux sociaux. Il s'agit alors principalement d'identifier des personnes qui sont au cœur du réseau, appelées leaders d'opinion. Par principe, de tels leaders d'opinion ont des influences fortes, c'est-à-dire que les contenus qu'ils produisent sont repris par de nombreuses autres sources, si bien qu'une même information est obtenue avec une grande redondance en réponse à une requête d'interrogation. De ce fait, les sources de contenus qui sont leaders d'opinion masquent directement et indirectement des sources à faible occurrence dans les réponses à une requête d'interrogation . A cause de cela, des informations utiles qui sont faiblement reprises, aussi appelées signaux faibles, deviennent plus difficilement accessibles dans une masse d'informations fortement médiatisées. A partir de cette situation, un but de la présente invention est de fournir à un utilisateur un accès facilité à une source de contenus qui est à l'origine d'une information précoce sur des événements, surtout si cette source a une faible audience ou apparaît avec un faible niveau d'occurrence dans les bases de données. Une telle source d'information précoce est appelée source clairvoyante dans la présente description, indépendamment de son audience et de son niveau d'influence sur d'autres sources. Une source clairvoyante à faible niveau d'audience sera nommée «source faible». But collaborative filtering is only possible if the user agrees to share its uses with a community, which is not compatible with documentary surveillance that is part of a competitive framework or a security framework. Moreover, machine learning often implies a certain inertia, which does not make it possible to rapidly evolve, when it may be necessary, the characteristics of fields of interest that are derived from prior uses. In addition, these characteristics concerning prior uses, which are derived from the analysis of the user's uses, are often low in quality and quantity. To further improve the relevance of the content that is provided to the user in response to a query query based on a The field of interest that he has entered, it is also known to identify sources of useful content that have already been provided to this user. Thus, in addition to each content, the source of it can be communicated to the user, such as for example a Twitter account, a media or blog website, etc. It is then possible for the user to "follow" these sources by systematically or selectively consulting the content they produce. These sources may also produce content outside the domain of interest entered by the user, which can help to change this area of interest. Thus, a source that has shown an important ability to produce useful content for a particular area of interest can also produce content that is relevant to the user outside of that particular area or boundary thereof. Such identification of sources is already widely practiced in the context of social network analysis. It is then mainly to identify people who are at the heart of the network, called opinion leaders. As a matter of principle, such opinion leaders have strong influences, that is to say that the contents they produce are taken up by many other sources, so that the same information is obtained with a great deal of redundancy. response to a query request. As a result, content sources that are opinion leaders directly and indirectly mask low-occurrence sources in the responses to a query. Because of this, useful information that is weakly repeated, also called weak signals, becomes more difficult to access in a mass of highly publicized information. From this situation, an object of the present invention is to provide a user with easy access to a source of content that is the source of early information on events, especially if this source has a small audience or appears with a low level of occurrence in the databases. Such an early source of information is referred to herein as the clairvoyant source, regardless of its audience and level of influence on other sources. A clairvoyant source with a low audience level will be called a "weak source".
Une fois que l'utilisateur a identifié une telle source clairvoyante et dispose d'un accès à celle-ci, il lui sera possible de la «suivre» pour disposer d'informations qui sont pertinentes pour lui le plus rapidement possible après que ces informations sont apparues une première fois. Once the user has identified such a clairvoyant source and has access to it, it will be possible for him to "follow" to have information that is relevant to him as soon as possible after this information appeared a first time.
Un but annexe de la présente invention est d'identifier des sources clairvoyantes pour des domaines d'intérêt qui sont susceptibles d'évoluer, du fait de l'utilisateur ou du fait de tendances qui lui sont extérieures mais qui affectent la communauté des sources de contenus. An ancillary object of the present invention is to identify clairvoyant sources for areas of interest that are likely to evolve, either because of the user or because of external trends that affect the community of sources of interest. content.
Pour atteindre l'un de ces buts ou d'autres, un premier aspect de la présente invention propose un procédé d'identification d'une source d'information, qui comprend les étapes suivantes à exécuter en utilisant un module de recherche automatique : To achieve one or other of these purposes, a first aspect of the present invention provides a method of identifying an information source, which comprises the following steps to be performed using an automatic search module:
IM produire au moins une requête d'interrogation qui correspond à plusieurs événements ; et IM produce at least one query query that corresponds to several events; and
121 collecter en provenance d'au moins une base de données, des références de contenus qui sont obtenues en réponse à la requête d'interrogation, et dont les contenus correspondent chacun à l'un au moins des événements, et pour chaque contenu, identifier une source et une date de production de ce contenu. 121 collect from at least one database, content references that are obtained in response to the query query, and whose contents each correspond to at least one of the events, and for each content, identify a source and a date of production of this content.
De façon générale dans la présente description, on entend par «au moins une requête d'interrogation» un ensemble de requêtes d'interrogation, pouvant contenir une ou plusieurs requêtes d'interrogation, qui sont mises en œuvre lors d'une même exécution du procédé de l'invention. In general, in the present description, the term "at least one interrogation request" is understood to mean a set of interrogation requests, which may contain one or more interrogation requests, which are implemented during the same execution of the interrogation request. method of the invention.
Selon l'invention, le procédé comprend en outre les étapes supplémentaires suivantes : 131 parmi les sources identifiées, sélectionner au moins une source qui a produit au moins un contenu relatif à au moins un des événements de l'étape IM ; According to the invention, the method further comprises the following additional steps: 131 among the identified sources, selecting at least one source that has produced at least one content relating to at least one of the events of step IM;
IAI pour chaque source sélectionnée à l'étape 131, et pour chaque contenu produit par cette source qui est relatif à l'un des événements de l'étape IM, déterminer un devancement temporel acquis par la source en ayant produit ce contenu, par rapport à une date de l'événement ou par rapport à une date où d'autres contenus relatifs au même événement ont été produits, puis combiner les devancements temporels acquis par une même des sources sélectionnées à l'étape 131 afin de calculer une valeur numérique, appelée valeur d'anticipation et attribuée à la source, qui varie de façon monotone en fonction de chaque devancement temporel déterminé pour cette source ; puis IAI for each source selected in step 131, and for each content produced by this source that is relative to one of the events of step IM, determining a temporal advance acquired by the source having produced this content, relative to on a date of the event or by report at a date when other contents relating to the same event have been produced, then combining the temporal clearances acquired by one of the sources selected in step 131 in order to calculate a numerical value, called the anticipation value and attributed to the source, which varies monotonously according to each temporal advance determined for this source; then
15/ fournir un identifiant de l'une au moins des sources sélectionnées à l'étape 131, avec la valeur d'anticipation qui a été calculée à l'étape IAI pour cette source. Eventuellement, à l'étape 131, il est possible de ne sélectionner une source que si elle a produit des contenus qui sont relatifs à plusieurs des événements de l'étape /M. Ainsi, le procédé de l'invention met en œuvre une corrélation entre des sous-ensembles de contenus qui ont été obtenus en réponse à la requête d'interrogation, et qui sont relatifs à des événements différents. La corrélation permet d'identifier les sources qui ont été actives au sujet de plusieurs événements, en minimisant l'importance des sources qui n'ont été actives que pour un seul des événements. De cette façon, les sources qui sont apparues dans les réponses alors qu'elles correspondent peu aux événements de la requête d'interrogation, sont écartées. Tous les contenus considérés à l'étape IAI peuvent correspondre à des références qui ont été collectées à l'étape 121. 15 / provide an identifier of at least one of the sources selected in step 131, with the anticipation value that has been calculated in step IAI for this source. Optionally, in step 131, it is possible to select a source only if it has produced contents that are related to several of the events of the step / M. Thus, the method of the invention implements a correlation between subsets of contents that have been obtained in response to the interrogation request, and which relate to different events. Correlation identifies sources that have been active for multiple events, minimizing the importance of sources that have been active for only one event. In this way, the sources that appeared in the responses while they correspond little to the events of the interrogation request, are discarded. All content considered in step IAI may correspond to references that were collected at step 121.
En outre, le procédé de l'invention classe les sources qui ont été actives au sujet de plusieurs des événements, en fonction de leur anticipation cumulée par rapport à chaque événement, ou par rapport aux autres sources au sujet des événements concernés. Ainsi, une source qui a réagi en avance sur les autres à plusieurs événements ou qui a anticipé plusieurs événements plus que les autres sources, c'est-à-dire une source qui a été clairvoyante, est mise en évidence par le procédé de l'invention, et son identification est fournie à un opérateur de surveillance documentaire. Dans des premiers modes de mise en œuvre de l'invention, ladite au moins une requête d'interrogation est construite directement à partir d'une fourniture initiale de plusieurs événements. Autrement dit, les événements sont fixés et connus a priori par l'opérateur de surveillance documentaire qui applique l'invention. Dans ce cas, ladite au moins une requête d'interrogation est produite à l'étape IM à partir d'une saisie des événements dans le module de recherche automatique, et chaque devancement temporel qui est acquis par une source peut être déterminé à l'étape 141 comme une différence entre la date d'un des événements et une date à laquelle la source a produit un contenu relatif au même événement, et dont la référence a été collectée à l'étape 121. In addition, the method of the invention classifies the sources that have been active about several of the events, based on their cumulative anticipation with respect to each event, or with respect to other sources about the events involved. Thus, a source that has reacted in advance of others to several events or has anticipated several events more than the other sources, that is to say, a source that has been clairvoyant, is evidenced by the method of the invention, and its identification is provided to a document surveillance operator. In first embodiments of the invention, said at least one query request is constructed directly from an initial supply of several events. In other words, the events are fixed and known a priori by the document surveillance operator who applies the invention. In this case, said at least one query request is generated in step IM from an event capture in the automatic search module, and each time advance that is acquired by a source can be determined at the same time. step 141 as a difference between the date of one of the events and a date when the source has produced content relating to the same event, and whose reference was collected at step 121.
Dans des seconds modes de mise en œuvre de l'invention, les événements peuvent ne pas être connus a priori, mais sont sous-jacents dans les réponses qui sont obtenues à ladite au moins une requête d'interrogation. Les dates respectives de ces événements ne sont donc pas connues, mais des dates auxquelles sont produits simultanément ou en peu de temps de nombreux contenus qui correspondent à ladite au moins une requête d'interrogation, constituent des approximations de ces dates d'événements. Ces approximations peuvent alors être utilisées pour évaluer le devancement temporel de chaque contenu. L'étape IM de tels seconds modes de mise en œuvre de l'invention comprend alors de saisir une caractérisation d'un domaine d'intérêt dans le module de recherche automatique. La requête d'interrogation est ensuite déterminée à partir du domaine d'intérêt saisi, d'une façon qui est connue en soi. A l'étape 121, après avoir collecté les références de contenus qui ont été obtenues en réponse à la requête d'interrogation, des dates sont déterminées, auxquelles des plus grands nombres de ces contenus ont été produits. Chacune de ces dates est alors associée à un des événements de l'étape IM, même si cet événement peut rester inconnu. Alors, chaque devancement temporel qui est acquis par une source peut être déterminé à l'étape 141 comme une différence entre l'une des dates auxquelles a été produit un plus grand nombre de contenus dont les références ont été collectées à l'étape 121, et une date à laquelle la source a produit un contenu dont la référence a aussi été collectée à l'étape 121. In second embodiments of the invention, the events may not be known a priori, but are underlying in the responses that are obtained to said at least one query request. The respective dates of these events are not known, but dates that are produced simultaneously or in a short time many contents that correspond to said at least one query query, are approximations of these dates of events. These approximations can then be used to evaluate the temporal advance of each content. The step IM of such second embodiments of the invention then comprises entering a characterization of a field of interest in the automatic search module. The query query is then determined from the domain of interest entered, in a manner that is known per se. In step 121, after collecting the content references that were obtained in response to the query request, dates are determined, at which larger numbers of these contents have been generated. Each of these dates is then associated with one of the events of the step IM, even if this event may remain unknown. Then, each time advance that is acquired by a source can be determined in step 141 as a difference between one of the dates at which a greater number of contents were generated whose references were collected at step 121, and a date on which the source has produced content whose reference was also collected at step 121.
Dans des troisièmes modes de mise en œuvre de l'invention, des événements peuvent être connus a priori, auxquels peuvent s'ajouter d'autres événements qui sont détectés comme à l'étape IM des seconds modes de mise en œuvre. In third embodiments of the invention, events can be known a priori, to which can be added other events which are detected as in step IM of the second modes of the invention. Implementation.
De façon générale pour l'invention, la valeur d'anticipation qui est calculée pour chaque source sélectionnée à l'étape 131 peut être une fonction croissante de chaque devancement temporel qui a été acquis par cette source en ayant produit un contenu relatif à l'un des événements. De cette façon, une source clairvoyante est caractérisée par une valeur d'anticipation qui est élevée. In general terms for the invention, the anticipation value which is calculated for each source selected in step 131 may be an increasing function of each time advance that has been acquired by this source having produced a content relating to the one of the events. In this way, a clairvoyant source is characterized by a high anticipation value.
Possiblement, les étapes IAI et 151 peuvent être exécutées pour plusieurs sources qui ont été sélectionnées à l'étape 131, et leurs identifiants sont fournis à l'étape 151 en étant classés en fonction des valeurs d'anticipation qui ont été calculées pour chacune de ces sources. Possibly, the steps IAI and 151 can be executed for several sources that were selected in step 131, and their identifiers are provided in step 151 by being ranked according to the anticipation values that were calculated for each of these sources.
Aussi de façon générale, mais optionnellement, le procédé de l'invention peut comprendre une étape supplémentaire qui consiste à écarter des sources dont l'audience est trop importante, pour mettre plus en évidence les sources clairvoyantes à faible bruit. Pour cela, une valeur d'audience peut être déterminée pour chacune des sources qui ont été sélectionnées à l'étape 131, et l'une d'elles peut être rejetée si sa valeur d'audience est supérieure à une valeur-seuil prédéterminée, ou supérieure à la valeur d'audience d'au moins une autre des sources sélectionnées à l'étape 131. La valeur d'audience d'une source peut être notamment le nombre de consultations par des tiers des contenus qui ont été produits par cette source. Also generally, but optionally, the method of the invention may include an additional step of removing sources whose hearing is too important, to highlight more clairvoyant sources low noise. For this, an audience value can be determined for each of the sources that were selected in step 131, and one of them can be rejected if its audience value is greater than a predetermined threshold value, or greater than the audience value of at least one of the sources selected at step 131. The audience value of a source may include the number of third-party views of the content that was produced by that source. source.
Encore de façon générale pour l'invention, la requête d'interrogation qui est produite à l'étape IM peut être une agrégation de plusieurs requêtes élémentaires. Dans ce cas, l'agrégation est établie selon des règles d'agrégation prédéterminées, notamment des règles de proximité ou d'équivalence sémantique ou linguistique. Still in general terms for the invention, the query request that is produced in step IM may be an aggregation of several elementary requests. In this case, the aggregation is established according to predetermined aggregation rules, including rules of proximity or semantic or linguistic equivalence.
Dans des perfectionnements de l'invention, la valeur d'anticipation peut être calculée pour chaque source qui a été sélectionnée à l'étape 131, aussi en fonction de l'un au moins des paramètres suivants, en plus des devancements temporels acquis par cette source : - un nombre d'événements parmi tous ceux de l'étape IV, en relation avec chacun desquels au moins un contenu a été produit par la source dont la valeur d'anticipation est calculée ; In improvements of the invention, the anticipation value can be calculated for each source that has been selected in step 131, also as a function of at least one of the following parameters, in addition to the time delays acquired by this source: a number of events among all those of step IV, in relation to each of which at least one content has been produced by the source whose anticipation value is calculated;
- un nombre d'événements parmi tous ceux de l'étape IV, en relation avec chacun desquels aucun contenu n'a été produit par la source dont la valeur d'anticipation est calculée ; a number of events among all those of step IV, in relation to each of which no content has been produced by the source whose anticipation value is calculated;
- un nombre de contenus qui ont été produits en relation avec l'un au moins des événements de l'étape IV, et dont les références ont été collectées à l'étape 121, alors que la source dont la valeur d'anticipation est calculée a produit ou non un contenu en relation avec cet événement ; et a number of contents that have been produced in relation to at least one of the events of step IV, and whose references were collected in step 121, whereas the source whose anticipation value is calculated has produced or not content related to this event; and
- au moins une valeur d'un rapport de hauteur de pic sur largeur du même pic, relative à des variations d'un nombre de contenus qui ont été produits par jour en relation avec l'un des événements de l'étape IV, et dont les références ont été collectées à l'étape 121, alors que la source dont la valeur d'anticipation est calculée a produit ou non un contenu en relation avec cet événement. at least one value of a ratio of height of peak to width of the same peak, relative to variations of a number of contents that have been produced per day in relation with one of the events of step IV, and whose references were collected at step 121, whereas the source whose anticipation value is calculated has or has not produced a content related to this event.
De tels paramètres supplémentaires pour calculer la valeur d'anticipation d'une source permettent de mettre encore plus en évidence une source clairvoyante qui a été précoce et pertinente pour plusieurs événements. En outre, chaque événement peut être pondéré dans le calcul de la valeur d'anticipation, par une valeur d'importance de cet événement qui peut être évaluée par un expert, ou qui peut être évaluée par exemple en fonction de la hauteur et/ou largeur du pic des variations du nombre de contenus produits. Il est aussi possible de pénaliser une source qui n'a pas réagi à l'un des événements, ou encore de tenir compte de la réactivité générale à un événement. Ainsi, la valeur d'anticipation peut encore mieux rendre compte du mérite d'une source à couvrir plusieurs événements et à être précurseur sur ceux-ci. Le procédé de l'invention peut comprendre en outre l'étape suivante, qui est exécutée après l'étape 151 : /6/ obtenir au moins un contenu qui a été produit par une source dont l'identifiant et la valeur d'anticipation ont été fournis à l'étape /5/. Such additional parameters for calculating the anticipation value of a source make it possible to further highlight a clairvoyant source that has been early and relevant for several events. In addition, each event can be weighted in the calculation of the anticipation value, by an importance value of this event which can be evaluated by an expert, or which can be evaluated for example according to the height and / or peak width of variations in the number of contents produced. It is also possible to penalize a source that has not reacted to one of the events, or to take into account the general reactivity to an event. Thus, the value of anticipation can even better reflect the merit of a source to cover several events and to be precursor on them. The method of the invention may further comprise the following step, which is performed after step 151: / 6 / obtain at least one content that has been generated by a source whose identifier and anticipation value has been provided in step / 5 /.
Autrement dit, l'un des contenus qui a été produit par une source révélée comme étant clairvoyante par le procédé de l'invention, peut être fourni à l'opérateur de la surveillance documentaire. In other words, one of the contents that has been produced by a source revealed to be clairvoyant by the method of the invention may be provided to the operator of the documentary surveillance.
Possiblement aussi, le procédé de l'invention, comprenant les étapes /M à 15/ peut être exécuté deux fois, en utilisant le second mode de mise en œuvre indiqué plus haut pour la seconde exécution. Alors, le domaine d'intérêt dont la caractérisation est saisie à l'étape IM de la seconde exécution peut être déterminé au moins partiellement à partir d'un autre domaine d'intérêt qui est relatif à une source dont l'identifiant et la valeur d'anticipation ont été fournis à l'étape 15/ de la première exécution. De cette façon, la première exécution du procédé de l'invention permet d'identifier une source clairvoyante, et la seconde exécution peut être focalisée sur des sujets d'intérêt de cette source clairvoyante, qui peuvent n'avoir pas été couverts par la requête d'interrogation de la première exécution du procédé de l'invention. Possibly also, the method of the invention, including steps / M to 15 / can be executed twice, using the second implementation mode indicated above for the second execution. Then, the domain of interest whose characterization is entered in step IM of the second execution can be determined at least partially from another domain of interest which is relative to a source whose identifier and the value anticipation were provided at step 15 / of the first execution. In this way, the first execution of the method of the invention makes it possible to identify a clairvoyant source, and the second execution can be focused on subjects of interest from this clairvoyant source, which may not have been covered by the request. interrogation of the first execution of the method of the invention.
Un second aspect de l'invention propose un module de recherche automatique, qui comprend : A second aspect of the invention provides an automatic search module, which comprises:
- des moyens de production d'au moins une requête d'interrogation qui correspond à plusieurs événements, y compris optionnellement des moyens pour agréger plusieurs requêtes d'interrogation élémentaires ; means for producing at least one interrogation request that corresponds to several events, including optionally means for aggregating several elementary interrogation requests;
- des moyens de collecte, adaptés pour collecter en provenance d'au moins une base de données, des références de contenus qui sont obtenues en réponse à ladite au moins une requête d'interrogation, et dont les contenus correspondent chacun à l'un au moins des événements ; collection means, adapted to collect from at least one database, content references that are obtained in response to said at least one query request, and whose contents each correspond to one of the fewer events;
- des moyens d'identification, adaptés pour identifier une source et une date de production pour chaque contenu dont la référence a été collectée par les moyens de collecte ; - des moyens de sélection, adaptés pour sélectionner parmi des sources identifiées par les moyens d'identification, au moins une source qui a produit au moins un contenu relatif à au moins un des événements correspondant à la requête d'interrogation ; identification means adapted to identify a source and a production date for each content whose reference has been collected by the collection means; selection means adapted to select from sources identified by the identification means, at least one source which has produces at least one content relating to at least one of the events corresponding to the query request;
- des moyens de calcul adaptés pour déterminer pour chaque source sélectionnée par les moyens de sélection, un devancement temporel acquis par cette source en ayant produit un contenu relatif à un des événements, par rapport à une date de cet événement ou par rapport à une date où d'autres contenus relatifs au même événement ont été produits, puis pour combiner les devancements temporels acquis par une même des sources sélectionnées afin de calculer une valeur numérique, appelée valeur d'anticipation et attribuée à la source, qui varie de façon monotone en fonction de chaque devancement temporel déterminé pour cette source ; et calculation means adapted to determine for each source selected by the selection means, a temporal advance acquired by this source having produced a content relating to one of the events, with respect to a date of this event or in relation to a date where other contents relating to the same event were produced, then to combine the temporal compensations acquired by one of the selected sources in order to calculate a numerical value, called anticipation value and attributed to the source, which varies monotonically in the function of each time advance determined for that source; and
- des moyens de sortie, adaptés pour fournir un identifiant de l'une au moins des sources sélectionnées, avec la valeur d'anticipation calculée pour cette source. - Output means, adapted to provide an identifier of at least one of the selected sources, with the anticipation value calculated for this source.
Un tel module de recherche automatique est adapté pour exécuter un procédé conforme au premier aspect de l'invention, possiblement y compris les perfectionnements et modes de mise en œuvre mentionnés pour ce procédé. Such an automatic search module is adapted to perform a method according to the first aspect of the invention, possibly including the improvements and embodiments mentioned for this method.
Optionnellement, les moyens de sélection peuvent être adaptés pour sélectionner parmi les sources identifiées par les moyens d'identification, au moins une source qui a produit des contenus relatifs à plusieurs des événements correspondant à la requête d'interrogation . Optionally, the selection means may be adapted to select from the sources identified by the identification means, at least one source that has produced content relating to several of the events corresponding to the query request.
Plus particulièrement, pour exécuter les premiers modes de mise en œuvre qui ont été mentionnés plus haut, les moyens de production de la requête d'interrogation peuvent être adaptés pour permettre à un utilisateur de saisir plusieurs événements, et en outre pour produire la requête d'interrogation à partir des événements saisis. Dans ce cas, les moyens de calcul peuvent être adaptés pour déterminer chaque devancement temporel, pour une source sélectionnée qui a produit un contenu relatif à plusieurs des événements, comme une différence entre la date d'un des événements et une date à laquelle cette source a produit un contenu relatif au même événement, et dont la référence a été collectée par les moyens de collecte. Pour exécuter les seconds modes de mise en œuvre qui ont été mentionnés plus haut, les moyens de production de la requête d'interrogation sont adaptés pour permettre à un utilisateur de saisir un domaine d'intérêt. Le module de recherche automatique comprend alors en outre des moyens de comptage adaptés pour compter, pour plusieurs dates, des contenus qui ont été produits à chacune de ces dates, et dont les références ont été collectées par le module de collecte. Il détermine ensuite celles des dates auxquelles des plus grands nombres de ces contenus ont été produits. Chaque date qui est ainsi déterminée est associée à un événement qui correspond à ladite au moins une requête d'interrogation. En outre, les moyens de calcul peuvent être adaptés pour déterminer chaque devancement temporel, pour une source sélectionnée par les moyens de sélection, comme une différence entre l'une des dates auxquelles a été produit un plus grand nombre de contenus dont les références ont été collectées par les moyens de collecte, et une date à laquelle la source a produit un contenu dont la référence a aussi été collectée par les moyens de collecte. More particularly, in order to execute the first modes of implementation mentioned above, the means for producing the query request can be adapted to allow a user to enter several events, and furthermore to produce the query of query from the events entered. In this case, the calculation means can be adapted to determine each time advance, for a selected source that has produced a content relating to several of the events, as a difference between the date of one of the events and a date on which this source produced content related to the same event, and whose reference was collected by the collection means. In order to execute the second modes of implementation mentioned above, the means for producing the query request are adapted to allow a user to enter a field of interest. The automatic search module then further comprises counting means adapted to count, for several dates, the contents that were produced at each of these dates, and whose references were collected by the collection module. It then determines the dates on which the largest numbers of these contents were produced. Each date that is thus determined is associated with an event that corresponds to said at least one query request. In addition, the calculation means may be adapted to determine each time advance, for a source selected by the selection means, as a difference between one of the dates on which a greater number of contents whose references have been produced has been produced. collected by the collection means, and a date on which the source has produced a content whose reference has also been collected by the collection means.
Enfin, un troisième aspect de l'invention propose un programme d'ordinateur qui comprend des codes adaptés pour produire une exécution d'un procédé conforme au premier aspect de l'invention, lorsque ces codes sont lus et exécutés par au moins un processeur, et que ce processeur a un accès à la base de données. Pour la présente demande de brevet, un tel programme est considéré comme un produit en tant que tel, qui est issu de l'invention et qui apporte une fonction nouvelle à un ordinateur. Pour cette raison, il est désigné par produit programme d'ordinateur. D'autres particularités et avantages de la présente invention apparaîtront dans la description ci-après d'exemples de mise en œuvre non limitatifs, en référence aux dessins annexés, dans lesquels : Finally, a third aspect of the invention provides a computer program that includes codes adapted to produce an execution of a method according to the first aspect of the invention, when these codes are read and executed by at least one processor, and that this processor has access to the database. For the present patent application, such a program is considered as a product as such, which is derived from the invention and which brings a new function to a computer. For this reason, it is referred to as a computer program product. Other features and advantages of the present invention will emerge in the following description of nonlimiting exemplary embodiments, with reference to the appended drawings, in which:
- la figure 1 est un diagramme chronologique montrant plusieurs sources de contenus ; - la figure 2a est un diagramme d'étapes pour des premiers modes de mise en œuvre possibles de la présente invention ; - la figure 2b est un diagramme temporel de production de contenus dont les références ont été collectées, qui illustre les premiers modes de mise en œuvre de l'invention ; - Figure 1 is a timing diagram showing several sources of content; Figure 2a is a step diagram for first possible embodiments of the present invention; FIG. 2b is a temporal diagram of content production whose references have been collected, which illustrates the first modes of implementation of the invention;
- la figure 3a est un diagramme d'étapes pour des seconds modes de mise en œuvre possibles de la présente invention ; et FIG. 3a is a diagram of steps for second possible embodiments of the present invention; and
- la figure 3b est un diagramme temporel de production de contenus dont les références ont été collectées, qui illustre les seconds modes de mise en œuvre de l'invention. FIG. 3b is a temporal diagram of production of contents whose references have been collected, which illustrates the second modes of implementation of the invention.
Dans ces figures, des références identiques désignent des éléments identiques, ou qui ont des rôles identiques. In these figures, identical references designate elements that are identical, or that have identical roles.
Dans la présente description d'invention, on entend par événement tout fait ou manifestation qui a appartenu à l'actualité à un moment, qui est appelé date de l'événement. Selon le contexte, une date peut signifier une date journalière, mais aussi plus généralement l'identification d'un instant avec une précision quelconque : date avec heure, date avec numéro de semaine, avec indication de mois, ou encore seulement avec une indication d'année, etc. In the present invention description, an event is any event or manifestation that belonged to the news at a time, which is called the date of the event. Depending on the context, a date may mean a daily date, but also more generally the identification of a moment with any precision: date with time, date with number of week, with indication of month, or only with an indication of year, etc.
On entend par contenu toute donnée ou document, y compris un lien vers un site ou une page de site, toute information, ensemble d'informations, article, image, vidéo, message, notamment publié par l'intermédiaire d'un réseau social, qui peut être obtenu en réponse à une requête d'interrogation. Content means any data or document, including a link to a site or site page, any information, set of information, article, image, video, message, including published via a social network, which can be obtained in response to a query request.
On entend par base de données tout regroupement ou collection de contenus qui peut être interrogé en formulant une requête d'interrogation, et dont un certain nombre de contenus peuvent être sélectionnés pour être fournis à un utilisateur en réponse à la requête d'interrogation. On entend par référence d'un contenu tout type de référence qui permet à l'utilisateur d'accéder à ce contenu, notamment des références d'accès, par exemple un lien à une page internet du contenu, des références bibliographiques, ou des combinaisons de références de types variables. Par simplicité et clarté de rédaction, on pourra dans certains cas confondre un contenu collecté avec un contenu dont la référence a été collectée. On entend par source tout auteur auquel un contenu est attribué, ou tout éditeur référencé pour la publication du contenu. Une source peut éventuellement produire plusieurs contenus qui sont relatifs à un même événement. Possiblement aussi, un même contenu peut avoir plusieurs sources différentes, par exemple plusieurs auteurs qui ont collaboré. By database is meant any grouping or collection of contents that can be queried by formulating a query, and a certain number of contents may be selected to be provided to a user in response to the query request. A reference refers to any type of reference that allows the user to access this content, including access references, for example a link to a content web page, bibliographic references, or combinations references of variable types. For simplicity and clarity of writing, it may in some cases confuse content collected with content whose reference has been collected. By source we mean any author to whom a content is attributed, or any publisher referenced for the publication of the content. A source can possibly produce several contents that are related to the same event. Possibly also, the same content can have several different sources, for example several authors who collaborated.
On entend par identifiant d'une source toute coordonnée ou référence, telle que par exemple une adresse de courrier électronique, une référence de site internet ou de réseau social, etc., qui permet d'identifier la source de façon univoque. On entend par date de production d'un contenu une date qui est affectée à ce contenu dans une base de données, pour repérer l'incorporation du contenu dans cette base de données. Il s'agit donc d'une date de mise à disposition du contenu, à l'intention d'un utilisateur de la base de données. The term identifier of a source any coordinate or reference, such as for example an e-mail address, a website reference or social network, etc., which identifies the source uniquely. The date of production of a content is a date that is assigned to that content in a database, to identify the incorporation of the content in this database. It is thus a date of provision of the content, for the benefit of a user of the database.
On entend par module de recherche automatique toute entité fonctionnelle, matérielle ou logicielle qui permet d'interroger une base de données, et de fournir en réponse des références de contenus qui correspondent à la requête utilisée pour l'interrogation. Un tel module de recherche automatique peut comprendre un moteur de recherche tel que connu du grand public, mais comprend aussi des fonctionnalités de calcul d'une valeur d'anticipation pour mettre en œuvre la présente invention. Il peut être enrichi en outre de fonctionnalités supplémentaires et optionnelles, telles que l'exécution de procédés collaboratifs ou d'apprentissage automatique pour élaborer des requêtes d'interrogation. An automatic search module is understood to mean any functional, hardware or software entity that makes it possible to interrogate a database, and to provide in response references of contents that correspond to the query used for the interrogation. Such an automatic search module may include a search engine as known to the general public, but also includes features for calculating an anticipation value for implementing the present invention. In addition, it can be enriched with additional and optional features, such as running collaborative or machine-learning processes to build query queries.
Des sources produisent des contenus qui sont stockés dans une ou plusieurs base(s) de données, à des moments de production qui peuvent varier entre les contenus et/ou les sources. Sources produce content that is stored in one or more database (s), at times of production that may vary between content and / or sources.
Un utilisateur d'un réseau de communication qui fournit un accès à cette (ces) base(s) de données, peut utiliser un module de recherche automatique pour interroger la (les) base(s) de données sur la base d'une requête formulée par cet utilisateur. Cette requête détermine le domaine d'intérêt de l'utilisateur, qui est l'objet de sa recherche de contenus. Elle peut être élaborée en utilisant un formulaire de caractérisation du domaine d'intérêt, appelé ontologie générique dans le jargon de l'Homme du métier. Pour cela, l'utilisateur complète des champs de l'ontologie générique, tels qu'un champ d'indication de produit concerné, un champ d'indication d'utilisation, des champs d'indication de modèle, de cible visée, de marque, d'approvisionnement, d'origine, etc. La combinaison de ces champs tels que complétés par l'utilisateur est appelée ontologie métier et exprime le domaine d'intérêt de l'utilisateur pour interroger la (les) base(s) de données. A user of a communication network that provides access to this database (s), can use an automatic search module to query the database (s) based on a request formulated by this user. This request determines the domain of interest of the user, who is the object of his search for contents. It can be developed using a characterization form of the area of interest, called generic ontology in the jargon of the skilled person. For this purpose, the user completes fields of the generic ontology, such as a concerned product indication field, a usage indication field, model indication fields, targeted target, brand name fields. , sourcing, origin, etc. The combination of these fields as completed by the user is called the business ontology and expresses the domain of interest of the user to query the database (s) of data.
Le module de recherche automatique établit alors une requête pour interroger la (les) base(s) de données sur la base de la requête métier. Cette requête peut être établie à partir de l'ontologie métier seulement, telle qu'élaborée par l'utilisateur. The automatic search module then establishes a query to query the database (s) of data based on the business query. This request can be established from the business ontology only, as elaborated by the user.
Toutefois, il peut être avantageux, pour fournir à l'utilisateur des contenus plus pertinents ou un service enrichi, de combiner sa requête métier avec d'autres requêtes pour établir une requête finale sur la base de laquelle la (les) base(s) de données va (vont) être interrogée(s). Dans ce cas, la requête métier et chaque autre requête sont appelées requêtes élémentaires, et sont agrégées pour construire la requête finale, appelée requête d'interrogation avec laquelle la (les) base(s) de données est (sont) interrogée(s). Des règles d'agrégation prédéfinies sont utilisées pour cela, qui sont bien connues de l'Homme du métier. De telles règles d'agrégation traduisent notamment des proximités ou des équivalences sémantiques ou linguistiques, ou encore des opérations binaires sur les contenus des champs des requêtes élémentaires. However, it may be advantageous, to provide the user with more relevant content or a rich service, to combine his business query with other queries to establish a final query on the basis of which the database (s) data will be (are) queried. In this case, the business query and each other request are called elementary queries, and are aggregated to build the final query, called the query query with which the database (s) is (are) queried (s) . Predefined aggregation rules are used for this, which are well known to those skilled in the art. Such aggregation rules translate in particular semantic or linguistic proximities or equivalences, or even binary operations on the contents of the fields of the elementary requests.
Selon une première possibilité, la requête métier qui est établie par l'utilisateur peut être combinée avec au moins une autre requête métier qui a été établie par un autre utilisateur, préférablement sous condition de proximité entre ces utilisateurs. Un tel procédé d'interrogation est couramment appelé filtrage collaboratif par l'Homme du métier. According to a first possibility, the business request that is established by the user can be combined with at least one other business request that has been established by another user, preferably on the condition of proximity between these users. Such an interrogation method is commonly called collaborative filtering by the skilled person.
Eventuellement, l'une des requêtes élémentaires qui est combinée avec la requête métier établie par l'utilisateur, peut correspondre à une caractérisation de domaine d'intérêt relative à une source de contenus qui est active en particulier dans le domaine d'intérêt de l'utilisateur. Ainsi, la requête métier telle que produite par l'utilisateur peut être enrichie ou orientée en fonction de celle de la source, si bien que le domaine d'intérêt de l'utilisateur peut suivre celui de la source, éventuellement en tenant compte aussi d'une évolution du domaine d'intérêt de la source. La requête métier de la source, qui est destinée à former une requête élémentaire dans l'agrégation avec celle de l'utilisateur, peut avoir été établie par la source elle-même, par exemple pour faciliter l'accès aux contenus qu'elle a produits, ou d'une façon automatique, notamment par un module d'édition de contenus. Optionally, one of the basic requests that is combined with the business request established by the user, may correspond to a characterization of a domain of interest relating to a content source that is active in particular in the field of interest of the user. 'user. Thus, the business query as produced by the user can be enriched or oriented in according to that of the source, so that the field of interest of the user can follow that of the source, possibly also taking into account an evolution of the domain of interest of the source. The business request of the source, which is intended to form an elementary query in the aggregation with that of the user, may have been established by the source itself, for example to facilitate access to the content it has products, or automatically, including a content editing module.
Selon une seconde possibilité, le module de recherche automatique peut avoir mémorisé des requêtes métiers qui ont été établies antérieurement par l'utilisateur, et les agréger en tant que requêtes élémentaires pour construire la requête d'interrogation. L'agrégation peut alors résulter d'un procédé d'apprentissage, qui extrapole les requêtes métiers établies successivement par l'utilisateur. Alternativement ou en combinaison, la requête métier qui a été établie par l'utilisateur peut aussi être combinée avec des contenus qui ont été consultés antérieurement par l'utilisateur, et éventuellement en tenant compte d'appréciations de certains de ces contenus qui ont été saisies par l'utilisateur. De cette façon, la requête d'interrogation peut anticiper une évolution du domaine d'intérêt de l'utilisateur. Un tel procédé d'interrogation est couramment appelé filtrage par apprentissage par l'Homme du métier. According to a second possibility, the automatic search module may have stored business requests that were previously established by the user, and aggregate them as basic requests to build the query query. The aggregation can then result from a learning process, which extrapolates the business requests established successively by the user. Alternatively or in combination, the business request that has been established by the user can also be combined with content that has been previously consulted by the user, and possibly taking into account the assessments of some of these contents that have been entered. by the user. In this way, the query request can anticipate an evolution of the user's field of interest. Such an interrogation method is commonly called filtering by human learning of the art.
Dans les figures 1 , 2b et 3b, l'axe horizontal repère symboliquement le temps, noté t, avec un ordre chronologique de gauche à droite des figures. Sur la figure 1 , SrS4 désignent des sources de contenus qui sont stockés dans la (les) base(s) de données BD. De tels contenus sont indiqués génériquement par la lettre D. Le module de recherche automatique est désigné par la référence 1 . L'utilisateur, ou opérateur de surveillance documentaire, est noté U, et la requête d'interrogation notée RQ. L'accolade à droite de la figure 1 désigne ceux des contenus D de la base de données BD qui correspondent à la requête d'interrogation RQ, à l'exclusion de contenus qui ne correspondent pas à cette requête d'interrogation. In Figures 1, 2b and 3b, the horizontal axis symbolically marks the time, noted t, with a chronological order from left to right of the figures. In FIG. 1, SrS 4 denote sources of contents that are stored in the data base (s) BD. Such contents are indicated generically by the letter D. The automatic search module is designated by the reference 1. The user, or document monitoring operator, is denoted U, and the interrogation request denoted RQ. The brace on the right of FIG. 1 designates those contents D of the database BD that correspond to the interrogation request RQ, excluding contents that do not correspond to this interrogation request.
Le module de recherche automatique 1 collecte des références des contenus D qui correspondent à la requête d'interrogation RQ, ainsi que les dates de production et les sources de ces contenus. Dans l'exemple de la figure 1 , la source Si ne produit pas de contenu qui corresponde à la requête d'interrogation RQ. La source S2 produit plusieurs contenus qui correspondent à la requête d'interrogation RQ, dont le contenu noté D2 à la date T(D2). De même, la source S3 produit plusieurs contenus qui correspondent à la requête d'interrogation RQ, dont le contenu noté D3 à la date T(D3). Et aussi, la source S4 produit plusieurs contenus qui correspondent à la requête d'interrogation RQ, dont le contenu noté D4 à la date T(D4). A titre d'illustration, le contenu D2 a été produit par la source S2 avant le contenu D3 produit par la source S3, ce dernier avant le contenu D produit par la source S4. Le module de recherche automatique 1 collecte donc en particulier les références, les identifiants des sources et les dates de production des contenus D2, D3 et D4. The automatic search module 1 collects references of the contents D which correspond to the request for interrogation RQ, as well as the production dates and sources of these contents. In the example of Figure 1, the source Si does not produce content that corresponds to the query RQ query. The source S2 produces several contents that correspond to the interrogation request RQ, whose content noted D 2 at the date T (D 2 ). Likewise, the source S 3 produces several contents that correspond to the interrogation request RQ, whose content noted D 3 at the date T (D 3 ). And also, the source S 4 produces several contents that correspond to the interrogation request RQ, whose content noted D 4 at the date T (D 4 ). By way of illustration, the content D 2 has been produced by the source S 2 before the content D 3 produced by the source S 3 , the latter before the content D produced by the source S 4 . The automatic search module 1 thus collects in particular the references, the source identifiers and the production dates of the contents D 2 , D 3 and D 4 .
Les figures 2a et 2b illustrent des premiers modes de mise en œuvre de l'invention, dans lesquels des événements sont des données initiales du procédé. L'étape STi consiste en une saisie, par exemple par l'utilisateur U, d'une série d'événements qui sont désignés individuellement par EV-ι pour un premier de ces événements dont la date d'événement est T(EV-i), EV2 pour un deuxième de ces événements dont la date d'événement est T(EV2), etc. A partir de cette série d'événements EV-i, EV2,..., le module de recherche automatique 1 construit la requête d'interrogation RQ à l'étape ST2, et met en œuvre cette requête pour interroger la base de données BD. Le résultat de l'interrogation est un ensemble de contenus qui sont notés D,, Dj,... , dont le module de recherche automatique 1 collecte les références, les identifiants des sources qui ont produit ces contenus, et les dates de production de ces contenus (étape ST3). Ainsi, le contenu D, a été produit par la source S(Di) à la date T(Di), le contenu Dj a été produit par la source S(Dj) à la date T(Dj), etc. FIGS. 2a and 2b illustrate first embodiments of the invention, in which events are initial data of the method. The step STi consists of an input, for example by the user U, of a series of events that are individually designated by EV-ι for a first of these events whose event date is T (EV-i ), EV 2 for a second of these events whose event date is T (EV 2 ), etc. From this series of events EV-i, EV 2 ,..., The automatic search module 1 constructs the interrogation request RQ at the step ST 2 , and implements this request to interrogate the database of BD data. The result of the query is a set of contents that are denoted D ,, D j , ..., whose automatic search module 1 collects the references, the identifiers of the sources that produced these contents, and the production dates. of these contents (step ST 3 ). Thus, the content D, was produced by the source S (Di) at the date T (Di), the content Dj was produced by the source S (Dj) at the date T (Dj), etc.
A l'étape ST , le module de recherche automatique 1 classe les contenus qui ont ainsi été collectés en réponse à la requête d'interrogation RQ, en fonction des sources qui les ont produits. Par exemple, une même source Sk a produit au moins les deux contenus Dm et Dn, le contenu Dm à la date T(Dm) et le contenu Dn à la date T(Dn). Optionnellement, celles des sources qui ne correspondent chacune qu'à une seule référence de contenu collectée, peuvent être écartées de la suite du procédé, de sorte que ne sont conservées que les sources à contenus multiples. Pour chacune de celles-ci, chaque contenu qu'elle a produit est rapproché de celui des événements de l'étape STi auquel ce contenu se rapporte, et un devancement temporel est calculé. Par exemple, le contenu Dm qui a été produit par la source Sk concerne l'événement EVX, et le devancement temporel de la source Sk pour ce contenu Dm est T(EVX) - T(Dm), où T(EVX) est la date de l'événement EVX et T(Dm) est la date de production du contenu Dm par la source Sk. De même pour le contenu Dn qui a aussi été produit par la source Sk mais qui se rapporte à l'événement EVy : le devancement temporel de la source Sk pour ce contenu Dn est T(EVy) - T(Dn), où T(EVy) est la date de l'événement EVy et T(Dn) est la date de production du contenu Dn. La source Sk est sélectionnée en outre de sorte que les événements EVX et EVy soient différents l'un de l'autre. Tous les devancements temporels qui sont acquis par la source Sk en ayant produit des contenus différents, sont alors combinés à l'étape ST5 pour calculer une valeur d'anticipation VA(Sk) qui est attribuée à cette source Sk. Autrement dit : VA(Sk) = f{... , T(EVX) - T(Dm), T(EVy) - T(Dn), ...}, où f est une fonction de combinaison de tous les devancements temporels d'une même source de contenus. La valeur d'anticipation VA(Sk) est alors fournie à l'utilisateur U avec un identifiant de la source Sk. Le diagramme de la figure 2b représente les variations des nombres de contenus qui ont été produits par jour pour les deux événements EVX (courbe notée x) et EVy (courbe notée y), et dont les références ont été collectées à l'étape ST3. L'axe des ordonnées de ce diagramme, noté N/j, repère donc ces nombres de contenus produits par unité de temps, par exemple par jour. La courbe x montre que les contenus relatifs à l'événement EVX ont principalement été produits avec retard par rapport à la date T(EVX) de cet événement. Tel est le cas, notamment, pour le contenu Dm, puisque la différence de dates T(EVX) - T(Dm), qui constitue le devancement temporel, est négative. A la différence, de nombreux contenus relatifs à l'événement EVy, dont le contenu Dn, ont été produits avant cet événement EVy, correspondant à des contenus anticipatifs ou prémonitoires. Le devancement temporel T(EVy) - T(Dn) est alors positif. In step ST, the automatic search module 1 classifies the contents that have been collected in response to the query query RQ, depending on the sources that produced them. For example, a same source Sk has produced at least the two contents D m and D n , the content D m at the date T (D m ) and the content D n at the date T (D n ). Optionally, those sources that each correspond to only one reference of collected content, can be removed from the rest of the process, so that are not preserved than multi-content sources. For each of these, each content that it has produced is brought closer to that of the events of the step STi to which this content relates, and a temporal advance is calculated. For example, the content D m that has been produced by the source S k concerns the event EV X , and the temporal advance of the source S k for this content D m is T (EV X ) - T (D m ), where T (EV X ) is the date of the event EV X and T (D m ) is the production date of the content D m by the source Sk. Similarly for the content D n which has also been produced by the source S k but which relates to the event EV y : the temporal advance of the source S k for this content D n is T (EV y ) - T (D n ), where T (EVy) is the date of the event EV y and T (D n ) is the production date of the content D n . Sk source is selected further so that the EV EV events X and y are different from one another. All the time advances that are acquired by the source S k having produced different contents, are then combined at the step ST 5 to calculate a forward value VA (Sk) which is attributed to this source Sk. In other words: VA (Sk) = f {..., T (EV X ) - T (D m ), T (EV y ) - T (D n ), ...}, where f is a combination function of all time outflows of the same source of contents. The anticipation value VA (Sk) is then supplied to the user U with an identifier of the source Sk. The diagram of FIG. 2b represents the variations of the number of contents that have been produced per day for the two EV events X (curve denoted x) and EV y (curve denoted y), and whose references were collected in step ST 3 . The ordinate axis of this diagram, denoted N / j, thus locates these numbers of contents produced per unit of time, for example per day. The curve x shows that the contents relating to the event EV X have mainly been produced late compared to the date T (EV X ) of this event. This is the case, in particular, for the content D m , since the difference of dates T (EV X ) - T (D m ), which constitutes the temporal advance, is negative. In contrast, many content related to EV event y , whose content D n , were produced before this event EV y , corresponding to anticipatory or premonitory contents. The temporal advance T (EV y ) - T (D n ) is then positive.
De retour à la figure 2a, l'étape ST-ι est exécutée en utilisant des moyens de saisie du module de recherche automatique 1 , l'étape ST2 est exécutée par des moyens de production de requêtes d'interrogation, l'étape ST3 est exécutée par des moyens de collecte de contenus en combinaison avec des moyens d'identification de sources et de dates de production des contenus, et les étapes ST4 et ST5 sont exécutées par des moyens de sélection des sources de contenus en combinaison avec des moyens de calcul du module de recherche automatique 1 . Returning to FIG. 2a, the step ST-ι is executed using input means of the automatic search module 1, the step ST 2 is executed by means for producing interrogation requests, the step ST 3 is executed by content collection means in combination with means for identifying sources and dates of production of the contents, and the steps ST 4 and ST 5 are executed by content source selection means in combination with calculation means of the automatic search module 1.
Les figures 3a et 3b illustrent des seconds modes de mise en œuvre de l'invention, dans lesquels les événements auxquels se rapportent les contenus collectés ne sont pas connus initialement par l'utilisateur U. L'étape ST-T consiste en une saisie, par exemple par l'utilisateur U, d'un domaine d'intérêt Dl, par exemple en utilisant une requête métier telle que décrit plus haut. A l'étape ST2', le module de recherche automatique 1 construit la requête d'interrogation RQ à partir du domaine d'intérêt Dl. L'interrogation de la base de données BD par la requête RQ et l'étape ST3 de collecte des références de contenus qui correspondent à la requête RQ sont identiques à celles des modes de mise en œuvre de la figure 2a. FIGS. 3a and 3b illustrate second embodiments of the invention, in which the events to which the collected contents refer are not known initially by the user U. The ST-T step consists of an input, for example by the user U, of a domain of interest D1, for example by using a business request as described above. In step ST 2 ', the automatic search module 1 constructs the query RQ query from the field of interest Dl. The interrogation of the database BD by the request RQ and the step ST 3 of collection of content references that correspond to the request RQ are identical to those of the implementation modes of Figure 2a.
L'étape additionnelle ST3' est illustrée par la figure 3b, et a pour but de déterminer, avec autant de vraisemblance que possible, les dates des événements qui sont concernés par les contenus dont les références ont été collectées à l'étape ST3. Cette vraisemblance est supérieure lorsque les dates de production des contenus sont regroupées dans des périodes séparées ou à peu près séparées, si bien que l'existence d'un événement distinct peut être attribuée à chaque période. The additional step ST 3 'is illustrated by FIG. 3b, and aims to determine, with as much likelihood as possible, the dates of the events that are concerned by the contents whose references were collected at the step ST 3 . This likelihood is greater when the content production dates are grouped into separate or roughly separate periods, so that the existence of a separate event can be attributed to each period.
A l'étape ST3', le module de recherche automatique 1 identifie des maxima dans les variations du nombre N/j des contenus qui ont été produits par jour pendant une période d'analyse PA, et dont les références ont été collectées à l'étape ST3. Il s'agit cette fois du nombre total des contenus collectés par unité de temps, par exemple par jour, quel que soit l'événement qui est concerné par chaque contenu. Par exemple, la courbe du nombre N/j en fonction du temps t qui est représentée dans le diagramme de la figure 3b peut présenter trois maxima, notés M-i, M2 et M3, correspondant aux dates T(M-i), T(M2) et T(M3) respectivement. Alors, partant de l'hypothèse que chaque maximunn de la courbe de N/j en fonction du temps t a été vraisemblablement provoqué par un événement couvert par la requête d'interrogation RQ, le maximum Mi est identifié dans la suite du procédé à un premier événement qui se serait produit à la date T(M-i), et de même le maximum M2 est identifié à un deuxième événement qui se serait produit à la date T(M2), et le maximum M3 est identifié à un troisième événement qui se serait produit à la date T(M3). Selon une autre hypothèse de vraisemblance, chaque contenu dont la référence a été collectée à l'étape ST3 concerne celui des événements ainsi identifié qui lui est le plus proche chronologiquement. Ainsi, dans l'exemple de la figure 3b, le contenu D2 est supposé relatif à l'événement du maximum M-i, en anticipant cet événement M-i, le contenu D3 est supposé relatif aussi à l'événement du maximum Mi, mais en lui étant postérieur, et le contenu D4 est supposé relatif à l'événement du maximum M2, avec anticipation par rapport à ce dernier. Dans la figure 3b, T(RQ) désigne la date à laquelle la requête d'interrogation RQ est utilisée dans la base de données BD. La date T(RQ) peut être la fin de la période d'analyse PA pendant laquelle les variations du nombre N/j en fonction du temps t sont analysées, mais pas nécessairement. La période d'analyse PA peut éventuellement être arrêtée avant la date T(RQ). L'étape ST4' de la figure 3a correspond à l'étape ST4 de la figure 2a en remplaçant la date réelle de l'événement concerné par chaque contenu par la date la plus vraisemblable d'un événement qui serait concerné par ce contenu, obtenue à partir des variations du nombre N/j en fonction du temps t comme cela vient d'être décrit. Ainsi, dans l'exemple de la figure 3b, la valeur d'anticipation VA(S2) de la source S2 dépend du devancement temporel positif T(M-i) - T(D2), la valeur d'anticipation VA(S3) de la source S3 dépend du devancement temporel négatif T(M-i) - T(D3), et la valeur d'anticipation VA(S4) de la source S4 dépend du devancement temporel positif T(M2) - T(D4). In step ST 3 ', the automatic search module 1 identifies maxima in the variations of the number N / j of the contents that were produced per day during a period of analysis PA, and whose references were collected at step ST 3 . This is the total number of content collected per unit of time, for example per day, regardless of the event that is affected by each content. For example, the curve of the number N / d as a function of time t which is represented in the diagram of FIG. 3b may have three maxima, denoted Mi, M 2 and M 3 , corresponding to the dates T (Mi), T (M 2 ) and T (M 3 ) respectively. So, assuming that each maximunn of the curve of N / j as a function of time was probably caused by an event covered by the interrogation request RQ, the maximum Mi is identified in the rest of the process to a first event that would have occurred on the date T (Mi), and likewise the maximum M 2 is identified with a second event that would have occurred on the date T (M 2 ), and the maximum M 3 is identified with a third event that would have occurred on the date T ( M 3 ). According to another hypothesis of likelihood, each content whose reference has been collected in step ST 3 concerns that of the events thus identified which is closest to it chronologically. Thus, in the example of FIG. 3b, the content D 2 is assumed to relate to the event of the maximum Mi, anticipating this event Mi, the content D 3 is assumed to also relate to the event of the maximum Mi, but it being posterior, and the content D 4 is assumed to relate to the event of the maximum M 2 , with anticipation with respect to the latter. In FIG. 3b, T (RQ) designates the date on which the query query RQ is used in the database BD. The date T (RQ) may be the end of the analysis period PA during which the variations of the number N / d as a function of time t are analyzed, but not necessarily. The analysis period PA can possibly be stopped before the date T (RQ). Step ST 4 'of FIG. 3a corresponds to step ST 4 of FIG. 2a, replacing the actual date of the event concerned by each content by the most likely date of an event that would be concerned by this content. , obtained from the variations of the number N / day as a function of time t as just described. Thus, in the example of FIG. 3b, the anticipation value VA (S 2 ) of the source S 2 depends on the positive time advance T (Mi) - T (D 2 ), the anticipation value VA (S 3 ) of the source S 3 depends on the negative time advance T (Mi) - T (D 3 ), and the anticipation value VA (S 4 ) of the source S 4 depends on the positive time advance T (M 2 ) - T (D 4 ).
De façon optionnelle aussi pour les seconds modes de mise en œuvre qui sont en train d'être décrits, une valeur d'anticipation peut n'être calculée que pour celles des sources qui ont produit au moins deux contenus qui ont correspondu à la requête RQ, et qui concernent des maxima différents du nombre N/j. Ainsi, pour la source Sk qui a produit un contenu Dm chronologiquement proche d'un maximum Mx du nombre N/j de contenus produits par jour, et qui a aussi produit un contenu Dn chronologiquement proche d'un maximum My du nombre N/j, la valeur d'anticipation VA(Sk) dépend des deux devancements temporels T(MX) - T(Dm) et T(My) - T(Dn), comme indiqué aux étapes ST4' et ST5' de la figure 3a. La fonction f, ayant pour variables les devancements temporels d'une même source, et qui a été utilisée dans les premiers modes de mise en œuvre de l'invention (figures 2a et 2b), peut être utilisée identiquement pour les seconds modes de réalisation de l'invention (figures 3a et 3b). Optionally also for the second embodiments that are being described, an anticipation value can be calculated only for those sources that have produced at least two contents that corresponded to the RQ request. , and which concern different maxima of the number N / d. Thus, for the source S k which produced a content D m chronologically close to a maximum M x of the number N / day of contents produced per day, and which also produced a content D n chronologically close to a maximum M y of the number N / d, the anticipation value VA (S k ) depends on the two temporal detours T (M X ) - T (D m ) and T (M y ) - T (D n ), as indicated in steps ST 4 'and ST 5 ' of Figure 3a. The function f, having as variables the temporal advances of the same source, and which was used in the first embodiments of the invention (FIGS. 2a and 2b), can be used identically for the second embodiments. of the invention (Figures 3a and 3b).
L'étape STY est exécutée en utilisant les moyens de saisie du module de recherche automatique 1 , l'étape ST2' est exécutée par les moyens de production de requêtes d'interrogation, l'étape ST3 est encore exécutée par des moyens de collecte de contenus en combinaison avec les moyens d'identification de sources et de dates de production des contenus, et les étapes ST4' et ST5' sont exécutées par les moyens de sélection des sources de contenus en combinaison avec les moyens de calcul du module de recherche automatique 1 . The step STY is executed using the input means of the automatic search module 1, the step ST 2 'is executed by the query request generation means, the step ST 3 is again executed by means of collecting content in combination with the means for identifying sources and content production dates, and the steps ST 4 'and ST 5 ' are executed by the source content selection means in combination with the means for calculating the content. automatic search module 1.
De préférence, la fonction f qui est utilisée pour calculer les valeurs d'anticipation est une fonction croissante de la valeur algébrique de chaque devancement temporel, exprimé comme la date de l'événement ou d'un maximum de la courbe du nombre N/j en fonction du temps t, réduite de la date de production du contenu, si bien qu'une source qui est plus clairvoyante possède une valeur d'anticipation qui est supérieure. Ainsi, la fonction f peut être telle que la contribution dans la valeur d'anticipation de celui des devancements temporels qui correspond au premier contenu qui a été produit par la source en relation avec un événement, est plus grande qu'une autre contribution correspondant à un autre contenu qui a aussi été produit par la même source en relation avec le même événement. Un exemple de telle fonction f peut être donné pour chaque événement EVX de date T(EVX), qui est soit détecté par l'analyse du nombre de documents produits par unité de temps, tel que ce nombre est issu de la requête RQ, soit fourni en entrée au module de recherche automatique, et pour chaque source Sk ayant produit un contenu Dn à la date T(Dn) qui est relatif à EVX, et donc retourné en réponse à la requête RQ. Ainsi, une contribution VAx(Sk) à la valeur d'anticipation de la source Sk relative à l'événement EVX, peut être par exemple : Preferably, the function f which is used to calculate the anticipation values is an increasing function of the algebraic value of each time advance, expressed as the date of the event or a maximum of the curve of the number N / d as a function of the time t, reduced by the date of production of the content, so that a source which is more clairvoyant has a value of anticipation which is higher. Thus, the function f can be such that the contribution in the anticipation value of that of the temporal advance that corresponds to the first content that has been produced by the source in relation to an event, is greater than another contribution corresponding to other content that has also been produced by the same source in relation to the same event. An example of such a function f can be given for each event EV X of date T (EV X ), which is either detected by the analysis of the number of documents produced per unit of time, such that this number comes from the request RQ , provided as input to the automatic search module, and for each source S k having produced a content D n at the date T (D n ) which is relative to EV X , and thus returned in response to the request RQ. Thus, a contribution VA x (Sk) to the anticipation value of the source Sk relative to the event EV X , can be for example:
VAx(Sk) = T(EVX) - T(Dn) si T(Dn) < T(EVX) et T(EVX) - T(Dn) < MA VA x (Sk) = T (EV X ) - T (D n ) if T (D n ) <T (EV X ) and T (EV X ) - T (D n ) <MA
VAx(Sk) = 0 si T(Dn) < T(EVX) et T(EVX) - T(Dn) > MA VA x (S k ) = 0 if T (D n ) <T (EV X ) and T (EV X ) - T (D n )> MA
VAx(Sk) = max(0, MA - (T(D„) - T(EVX))) si T(EVX) < T(D„) VA x (S k ) = max (0, MA - (T (D ") - T (EV X ))) if T (EV X ) <T (D")
où MA est une valeur constante prédéterminée qui représente la valeur maximale admise pour une contribution d'anticipation. Si la source Sk a produit plusieurs contenus Dn qui sont relatifs au même événement EVX, alors les contributions correspondantes à la valeur d'anticipation peuvent être ajoutées les unes aux autres. Ensuite, la valeur d'anticipation VA(Sk) de la source Sk peut être : VA(Sk)=∑EvxVAx(Sk). where MA is a predetermined constant value which represents the maximum value allowed for an anticipatory contribution. If the source S k has produced several contents D n which are related to the same event EV X , then the contributions corresponding to the anticipation value can be added to each other. Then, the anticipation value VA (Sk) of the source Sk can be: VA (S k ) = Σ E vxVA x (S k ).
Dans des perfectionnements de l'invention, la fonction f peut dépendre en outre de l'un des paramètres additionnels suivants :  In improvements of the invention, the function f may additionally depend on one of the following additional parameters:
- le nombre N+ k des événements parmi ceux de l'étape ST-i , ou parmi ceux qui ont été identifiés à l'étape ST3', qui sont concernés ou supposés concernés par les contenus collectés qui ont été produits par la source Sk, dont la valeur d'anticipation est calculée. Il est possible ainsi de rendre compte dans la valeur d'anticipation VA(Sk), que la source Sk a produit des contenus pertinents pour un grand nombre d'événements. A titre d'exemple, la valeur d'anticipation peut être remplacée par VA'(Sk) = VA(Sk)-N+ k, où VA(Sk) est telle que définie plus haut ; the number N + k of events among those of step ST-i, or among those identified in step ST 3 ', which are concerned or supposed to be concerned by the collected contents that have been produced by the source S k , whose anticipation value is calculated. It is thus possible to account in the anticipation value VA (S k ), that the source Sk has produced relevant contents for a large number of events. By way of example, the anticipation value can be replaced by VA '(Sk) = VA (Sk) -N + k , where VA (Sk) is as defined above;
- le nombre N" k des événements parmi ceux de l'étape ST-i , ou parmi ceux qui ont été identifiés à l'étape ST3', qui ne sont concernés ou qui sont supposés n'être concernés par aucun des contenus collectés qui ont été produits par la source Sk. Il est possible ainsi de rendre compte dans la valeur d'anticipation VA(Sk), que la source Sk a été muette, ou défaillante, par rapport à certains événements. A titre d'exemple, la valeur d'anticipation peut être remplacée par VA"(Sk) = VA(Sk)/N" k, où VA(Sk) est encore telle que définie plus haut ; - pour chaque événement EVX, le nombre NC(EVX), de contenus collectés qui ont été produits ou qui sont supposés avoir été produits, en relation avec cet événement, indépendamment du fait que la source Sk a ou n'a pas produit de contenu relatif à cet événement. Il est possible ainsi de moduler dans la valeur d'anticipation VA(Sk), la contribution de chaque couple formé par l'un des contenus produits par la source Sk avec l'événement concerné par ce contenu, en fonction de l'importance qu'a eue cet événement pour toutes les sources identifiées. A titre d'exemple, la contribution à la valeur d'anticipation peut être remplacée par VAx'(Sk) = VAx(Sk)-NC(EVx), où VAx(Sk) est telle que définie plus haut ; et the number N " k of the events among those of step ST-i, or among those identified in step ST 3 ', which are not concerned or which are supposed to be concerned by none of the collected contents which have been produced by the source S k.It is thus possible to account in the anticipation value VA (Sk), that the source Sk has been mute, or faulty, with respect to certain events. , the anticipation value can be replaced by VA "(Sk) = VA (Sk) / N " k , where VA (Sk) is still as defined above; for each event EV X , the number NC (EV X ) of collected content that has been produced or is supposed to have been produced, in connection with this event, regardless of whether the source S k has or has not content product related to this event. It is thus possible to modulate in the anticipation value VA (Sk), the contribution of each pair formed by one of the contents produced by the source S k with the event concerned by this content, depending on the importance what happened to this event for all identified sources. By way of example, the contribution to the anticipation value can be replaced by VAx '(Sk) = VA x (Sk) -NC (EV x ), where VA x (S k ) is as defined above; and
- pour chaque événement, une valeur d'un rapport HLX de hauteur de pic sur largeur de pic, qui concerne les variations du nombre N/j de contenus collectés qui ont été produits par unité de temps, en relation avec cet événement, indépendamment du fait que la source Sk a ou n'a pas produit de contenu relatif à cet événement. Il est possible ainsi de moduler dans la valeur d'anticipation VAx(Sk), la contribution de chaque couple formé par l'un des contenus produits par la source Sk avec l'événement concerné par ce contenu, en fonction de caractéristiques de la réaction qu'a provoquée cet événement pour toutes les sources identifiées. A titre d'exemple, la contribution à la valeur d'anticipation peut être remplacée par VAx"(Sk) = VAx(Sk)-HLx, où VAx(Sk) est encore telle que définie plus haut. for each event, a value of an HL X ratio of peak height over peak width, which concerns the variations in the number N / j of collected contents that have been produced per unit of time, in relation to this event, independently because the source S k has or has not produced content relating to this event. It is thus possible to modulate in the anticipation value VA x (Sk), the contribution of each pair formed by one of the contents produced by the source S k with the event concerned by this content, as a function of characteristics of the reaction caused by this event for all identified sources. By way of example, the contribution to the anticipation value can be replaced by VA x "(Sk) = VA x (Sk) -HL x , where VA x (Sk) is still as defined above.
Possiblement, les étapes ST4 et ST5, ou ST4' et ST5', peuvent être exécutées séparément pour plusieurs sources distinctes. Alors les identifiants de ces sources peuvent être fournis à l'utilisateur U à la fin du procédé dans l'ordre décroissant des valeurs d'anticipation qui ont été calculées. Les sources les plus clairvoyantes peuvent ainsi être présentées en premier à l'util isateur U. Possibly, the steps ST 4 and ST 5 , or ST 4 'and ST 5 ', can be executed separately for several different sources. Then the identifiers of these sources can be provided to the user U at the end of the process in descending order of the anticipation values that have been calculated. The most clairvoyant sources can thus be presented first to the user U.
Il est encore possible que des sources clairvoyantes qui ont des niveaux d'occurrence faibles dans la réponse qui a été obtenue à la requête d'interrogation RQ, soient reléguées à des valeurs d'anticipation moins bonnes à cause d'autres sources qui ont des niveaux d'occurrence plus forts. Le niveau d'occurrence d'une source, ou valeur d'occurrence, peut notamment être déterminé comme le nombre de contenus qu'elle a produits et qui ont été collectés à l'étape ST3. Alors, une source peut être optionnellement exclue de la suite du procédé si sa valeur d'occurrence est supérieure à une valeur-seuil fixe, ou est supérieure à une valeur-limite qui est ajustée en fonction des autres sources de contenus collectés. It is still possible that clairvoyant sources that have low occurrence levels in the response that has been obtained to the query query RQ, are relegated to worse anticipation values because of other sources that have problems. higher levels of occurrence. The the level of occurrence of a source, or occurrence value, can be determined in particular as the number of contents it has produced and which have been collected in step ST 3 . Then, a source may optionally be excluded from the remainder of the process if its occurrence value is greater than a fixed threshold value, or is greater than a limit value that is adjusted according to the other sources of content collected.
Une fois qu'une source clairvoyante a été identifiée selon l'invention, par sa valeur d'anticipation qui est bonne, il est possible de consulter l'un des contenus qu'elle a produit et qui a été collecté. Le temps de l'utilisateur, consacré à rechercher une information précurseur par rapport à un événement, a été réduit grâce à l'invention. Once a clairvoyant source has been identified according to the invention, by its anticipation value which is good, it is possible to consult one of the contents that it has produced and which has been collected. The user's time spent searching for precursor information with respect to an event has been reduced thanks to the invention.
Mais il est possible qu'une source clairvoyante produise des contenus précurseurs dans des domaines séparés, si bien que certains de ces contenus précurseurs ne sont pas collectés par la requête d'interrogation. Autrement dit, certains contenus qui sont produits par la source clairvoyante ne concernent pas les événements qui sont couverts par la requête d'interrogation. Dans ce cas, le procédé de l'invention peut être exécuté une première fois, correspondant à un premier ensemble d'événements, pour identifier la source clairvoyante, puis exécuté une seconde fois pour correspondre à un second ensemble d'événements qui est différent du premier, mais qui correspond mieux à l'ensemble des domaines d'activité de la source clairvoyante. Pour cela, pour la seconde exécution, à l'étape STY, le domaine d'intérêt qui est saisi est élaboré avantageusement en tenant compte d'un domaine d'intérêt de la source clairvoyante. De façon générale, l'invention permet d'indiquer à l'utilisateur celles des sources qui ont été actives les premières dans son domaine d'intérêt. Ainsi, en suivant ultérieurement ces sources, dans le même domaine d'intérêt ou dans des domaines proches, notamment des domaines extrapolés par filtrage collaboratif ou par apprentissage, l'utilisateur peut avoir un accès direct à des contenus précurseurs. L'accès à de tels contenus précurseurs peut alors être fourni à l'utilisateur par voie spécifique ou en priorité, par exemple au moyen d'alertes, si bien que l'utilisateur a connaissance de l'existence de ces contenus précurseurs même s'ils présentent un signal qui est encore faible pour des moteurs de recherche usuels. L'invention permet donc de privilégier la rapidité d'accès à une nouvelle information par rapport à des informations qui sont déjà largement vulgarisées. En effet, une information vraiment nouvelle, ou information précurseur, n'a pas encore eu le temps d'être répétée, reprise et/ou réutilisée par des sources secondaires de contenus autres que la source initiale de l'information précurseur. But it is possible that a clairvoyant source produces precursor contents in separate domains, so that some of these precursor contents are not collected by the interrogation request. In other words, some content that is produced by the clairvoyant source does not relate to the events that are covered by the query query. In this case, the method of the invention may be executed a first time, corresponding to a first set of events, to identify the clairvoyant source, then executed a second time to correspond to a second set of events which is different from the first set of events. first, but which better corresponds to all the fields of activity of the clairvoyant source. For this, for the second execution, in the STY step, the domain of interest that is entered is advantageously developed taking into account a field of interest of the clairvoyant source. In general, the invention makes it possible to indicate to the user which sources have been active first in his field of interest. Thus, by subsequently following these sources, in the same field of interest or in similar domains, particularly domains extrapolated by collaborative filtering or learning, the user can have direct access to precursor content. Access to such precursor contents can then be provided to the user by specific or priority means, for example by means of alerts, so that the user is aware of the existence of these precursor content even if they present a signal that is still weak for conventional search engines. The invention thus makes it possible to favor the speed of access to new information compared to information that is already widely available. Indeed, a really new information, or precursory information, has not yet had time to be repeated, taken back and / or reused by secondary sources of content other than the initial source of the precursor information.
Il est entendu que l'invention peut être reproduite en adaptant ou en modifiant des aspects secondaires de celle-ci, par rapport aux modes de mise en œuvre qui viennent d'être décrits en détail. En particulier, d'autres expressions mathématiques peuvent être utilisées pour calculer la valeur d'anticipation d'une source, sous condition de varier de façon monotone en fonction de chaque devancement temporel de la source qui est évaluée. En outre, il est rappelé que les formes des courbes qui sont représentées dans les figures 2b et 3b ne sont que des exemples d'évolution du nombre journalier de contenus qui correspondent à une requête d'interrogation. Notamment, le nombre de valeurs maximales de ce nombre journalier pendant la période d'analyse, ainsi que chaque valeur maximale, et la largeur et/ou la surface de chaque pic peuvent être quelconques, et ce indépendamment d'un pic à l'autre. It is understood that the invention may be reproduced by adapting or modifying secondary aspects thereof, with respect to the embodiments which have just been described in detail. In particular, other mathematical expressions can be used to calculate the anticipation value of a source, provided that it varies monotonically as a function of each time advance of the source that is evaluated. In addition, it is recalled that the shapes of the curves that are shown in Figures 2b and 3b are only examples of changes in the daily number of contents that correspond to a query query. In particular, the number of maximum values of this daily number during the analysis period, as well as each maximum value, and the width and / or the surface of each peak can be arbitrary, and this independently of a peak to another .

Claims

R E V E N D I C A T I O N S
1 . Procédé d'identification d'une source d'information, comprenant les étapes suivantes exécutées en utilisant un module de recherche automatique (1 ) : 1. A method of identifying an information source, comprising the following steps performed using an automatic search module (1):
IM produire au moins une requête d'interrogation (RQ) qui correspond à plusieurs événements ; et IM producing at least one query query (RQ) that corresponds to several events; and
121 collecter en provenance d'au moins une base de données (BD), des références de contenus (D2-D4) qui sont obtenues en réponse à la requête d'interrogation (RQ), et dont les contenus correspondent chacun à l'un au moins des événements, et pour chaque contenu, identifier une source (S2-S4) et une date (T(D2)-T(D4)) de production dudit contenu ; caractérisé en ce que le procédé comprend en outre : 121 collect from at least one database (BD), content references (D 2 -D 4 ) that are obtained in response to the query query (RQ), and whose contents each correspond to the at least one of the events, and for each content, identifying a source (S 2 -S 4 ) and a date (T (D 2 ) -T (D 4 )) of producing said content; characterized in that the method further comprises:
131 parmi les sources identifiées (S2-S ), sélectionner au moins une source qui a produit au moins un contenu (D2-D4) relatif à au moins un des événements de l'étape IM ; 131 among the sources identified (S 2 -S), selecting at least one source that has produced at least one content (D 2 -D 4 ) relating to at least one of the events of step IM;
IAI pour chaque source sélectionnée à l'étape 131, et pour chaque contenu produit par ladite source qui est relatif à l'un des événements de l'étape IM, déterminer un devancement temporel acquis par ladite source en ayant produit ledit contenu, par rapport à une date de l'événement ou par rapport à une date où d'autres contenus relatifs audit événement ont été produits, puis combiner les devancements temporels acquis par une même des sources sélectionnées à l'étape 131 afin de calculer une valeur numérique, appelée valeur d'anticipation et attribuée à ladite source, qui varie de façon monotone en fonction de chaque devancement temporel déterminé pour cette source ; puis IAI for each source selected in step 131, and for each content produced by said source that relates to one of the events of step IM, determining a time advance acquired by said source having produced said content, relative to at a date of the event or in relation to a date when other contents relating to said event have been produced, then combining the temporal clearances acquired by one of the sources selected in step 131 in order to calculate a numerical value, called anticipation value and attributed to said source, which varies monotonically according to each time advance determined for this source; then
15/ fournir un identifiant de l'une au moins des sources sélectionnées à l'étape 131, avec la valeur d'anticipation qui a été calculée à l'étape IAI pour ladite source. 15 / provide an identifier of at least one of the sources selected in step 131, with the anticipation value that has been calculated in step IAI for said source.
2. Procédé selon la revendication 1 , suivant lequel ladite au moins une requête d'interrogation (RQ) est produite à l'étape IM à partir d'une saisie des événements (EV-ι, EV2,...) dans le module de recherche automatique (1 ), et chaque devancement temporel qui est acquis par une source est déterminé à l'étape 141 comme une différence entre la date d'un des événements et une date à laquelle ladite source a produit un contenu relatif audit événement, et dont la référence a été collectée à l'étape 121. 2. Method according to claim 1, wherein said at least one interrogation request (RQ) is produced in step IM from an event capture (EV-ι, EV 2 , ...) in the automatic search module (1), and each time advance that is acquired by a source is determined in step 141 as a difference between the date of one of the events and a date that said source has produced content relating to said event , and whose reference was collected at step 121.
3. Procédé selon la revendication 1 , suivant lequel l'étape IM comprend : saisir une caractérisation d'un domaine d'intérêt (Dl) dans le module de recherche automatique (1 ), la requête d'interrogation (RQ) étant déterminée à partir du domaine d'intérêt saisi ; et suivant lequel l'étape 121 comprend, après avoir collecté les références de contenus obtenues en réponse à la requête d'interrogation (RQ) : déterminer des dates auxquelles des plus grands nombres desdits contenus ont été produits, chaque date ainsi déterminée étant associée à un des événements de l'étape IM, et suivant lequel chaque devancement temporel qui est acquis par une source est déterminé à l'étape 14/ comme une différence entre l'une des dates auxquelles a été produit un plus grand nombre de contenus dont les références ont été collectées à l'étape 121, et une date à laquelle ladite source a produit un contenu dont la référence a aussi été collectée à l'étape 121. 3. The method of claim 1, wherein the step IM comprises: entering a characterization of a domain of interest (Dl) in the automatic search module (1), the query query (RQ) being determined to from the field of interest entered; and wherein step 121 comprises, after collecting the content references obtained in response to the query query (RQ): determining dates at which larger numbers of said contents have been generated, each date thus determined being associated with one of the events of step IM, and according to which each temporal advance that is acquired by a source is determined in step 14 / as a difference between one of the dates at which a greater number of contents have been produced whose references were collected at step 121, and a date that said source produced content whose reference was also collected at step 121.
4. Procédé selon l'une quelconque des revendications précédentes, suivant lequel la valeur d'anticipation qui est calculée pour chaque source sélectionnée à l'étape 13/ est une fonction croissante de chaque devancement temporel acquis par ladite source en ayant produit un contenu relatif à l'un des événements. 4. A method according to any one of the preceding claims, wherein the anticipation value which is calculated for each source selected in step 13 / is an increasing function of each time advance acquired by said source having produced a relative content. at one of the events.
5. Procédé selon l'une quelconque des revendications précédentes, suivant lequel les étapes 141 et 15/ sont exécutées pour plusieurs sources sélectionnées à l'étape 131, et les identifiants desdites sources sont fournis à l'étape 15/ en étant classés en fonction des valeurs d'anticipation qui ont été calculées pour chacune desdites sources. The method of any one of the preceding claims, wherein steps 141 and 15 / are performed for a plurality of sources selected at step 131, and the identifiers of said sources are provided to step 15 / by being ranked according to the anticipation values that have been calculated for each of said sources.
6. Procédé selon l'une quelconque des revendications précédentes, suivant lequel une valeur d'occurrence est en outre déterminée pour chacune des sources sélectionnées à l'étape 131, et une desdites sources est rejetée si la valeur d'occurrence de ladite source est supérieure à une valeur-seuil prédéterminée, ou supérieure à la valeur d'occurrence d'au moins une autre des sources sélectionnées à l'étape 131. The method according to any one of the preceding claims, wherein an occurrence value is further determined for each of the sources selected in step 131, and one of said sources is rejected if the occurrence value of said source is greater than a predetermined threshold value, or greater than the occurrence value of at least one of the other sources selected in step 131.
7. Procédé selon l'une quelconque des revendications précédentes, suivant lequel la requête d'interrogation (RQ) produite à l'étape IM est une agrégation de plusieurs requêtes élémentaires, établie selon des règles d'agrégation prédéterminées, notamment des règles de proximité ou d'équivalence sémantique ou linguistique. 7. Method according to any one of the preceding claims, according to which the query request (RQ) produced in step IM is an aggregation of several elementary requests, established according to predetermined aggregation rules, in particular proximity rules. or semantic or linguistic equivalence.
8. Procédé selon l'une quelconque des revendications précédentes, suivant lequel la valeur d'anticipation est calculée pour chaque source sélectionnée à l'étape 131, aussi en fonction de l'un au moins des paramètres suivants : The method according to any one of the preceding claims, wherein the anticipation value is calculated for each source selected in step 131, also according to at least one of the following parameters:
- un nombre d'événements parmi les événements de l'étape IM, en relation avec chacun desquels au moins un contenu a été produit par ladite source ; a number of events among the events of the step IM, in relation to each of which at least one content has been produced by said source;
- un nombre d'événements parmi les événements de l'étape IM, en relation avec chacun desquels aucun contenu n'a été produit par ladite source ; a number of events among the events of the step IM, in relation to each of which no content has been produced by said source;
- un nombre de contenus qui ont été produits en relation avec l'un au moins des événements de l'étape IM, et dont les références ont été collectées à l'étape 121, ladite source ayant ou non produit un contenu en relation avec ledit événement ; et a number of contents that have been produced in relation to at least one of the events of step IM, and whose references were collected in step 121, said source having or not producing a content related to said event; and
- au moins une valeur d'un rapport de hauteur de pic sur largeur dudit pic, relative à des variations d'un nombre de contenus qui ont été produits par jour en relation avec l'un des événements de l'étape IM, et dont les références ont été collectées à l'étape 121, ladite source ayant ou non produit un contenu en relation avec ledit événement. at least one value of a ratio of peak height over width of said peak, relating to variations of a number of contents that have been produced per day in relation with one of the events of step IM, and of which the references were collected at step 121, said source having or not produced a content related to said event.
9. Procédé selon l'une quelconque des revendications précédentes, comprenant en outre l'étape suivante, exécutée après l'étape 151 : 16/ obtenir au moins un contenu qui a été produit par une source dont l'identifiant et la valeur d'anticipation ont été fournis à l'étape 151. The method of any one of the preceding claims, further comprising the following step, performed after step 151: 16 / obtaining at least one content that has been generated by a source whose identifier and the value of anticipation were provided at step 151.
10. Procédé selon l'une quelconque des revendications précédentes, comprenant une première exécution des étapes IM à 151, puis une seconde exécution des étapes IM à 151 conforme à la revendication 3, et suivant lequel le domaine d'intérêt (Dl) dont la caractérisation est saisie à l'étape IM de la seconde exécution est déterminé au moins partiellement à partir d'un autre domaine d'intérêt relatif à une source dont l'identifiant et la valeur d'anticipation ont été fournis à l'étape 151 de la première exécution . A method according to any one of the preceding claims, comprising a first execution of steps IM at 151, then a second execution of steps IM to 151 according to claim 3, and wherein the domain of interest (D1) whose characterization is entered in step IM of the second execution is determined at least partially from another domain of interest relating to a source whose identifier and the anticipation value were provided in step 151 of the first execution.
1 1 . Module de recherche automatique (1 ), comprenant : 1 1. Automatic search module (1), comprising:
- des moyens de production d'au moins une requête d'interrogation (RQ) qui correspond à plusieurs événements ; means for producing at least one interrogation request (RQ) that corresponds to several events;
- des moyens de collecte, adaptés pour collecter en provenance d'au moins une base de données (BD), des références de contenus (D2-D4) qui sont obtenues en réponse à ladite au moins une requête d'interrogation (RQ), et dont les contenus correspondent chacun à l'un au moins des événements ; et collection means, adapted to collect from at least one database (BD), content references (D 2 -D 4 ) which are obtained in response to said at least one query request (RQ ), and whose contents each correspond to at least one of the events; and
- des moyens d'identification, adaptés pour identifier une source (S2-S4) et une date de production pour chaque contenu (D2-D4) dont la référence a été collectée par les moyens de collecte ; caractérisé en ce que le module de recherche automatique (1 ) comprend en outre : identification means adapted to identify a source (S 2 -S 4 ) and a production date for each content (D 2 -D 4 ) whose reference has been collected by the collection means; characterized in that the automatic search module (1) further comprises:
- des moyens de sélection, adaptés pour sélectionner parmi des sources identifiées (S2-S ) par les moyens d'identification, au moins une source qui a produit au moins un contenu relatif à au moins un des événements correspondant à la requête d'interrogation (RQ) ; - des moyens de calcul adaptés pour déterminer pour chaque source sélectionnée par les moyens de sélection, un devancement temporel acquis par ladite source en ayant produit un contenu relatif à un des événements, par rapport à une date dudit événement ou par rapport à une date où d'autres contenus relatifs audit événement ont été produits, puis pour combiner les devancements temporels acquis par une même des sources sélectionnées afin de calculer une valeur numérique, appelée valeur d'anticipation et attribuée à ladite source, qui varie de façon monotone en fonction de chaque devancement temporel déterminé pour cette source ; et selection means adapted to select from identified sources (S 2 -S) by the identification means, at least one source which has produced at least one content relating to at least one of the events corresponding to the request of interrogation (RQ); calculating means adapted to determine for each source selected by the selection means, a temporal advance acquired by said source having produced a content relating to one of the events, with respect to a date of said event or in relation to a date in which other contents relating to said event have been produced, then to combine the temporal compensations acquired by one of the selected sources in order to calculate a numerical value, called anticipation value and attributed to said source, which varies monotonically as a function of each time advance determined for that source; and
- des moyens de sortie, adaptés pour fournir un identifiant de l'une au moins des sources sélectionnées, avec la valeur d'anticipation calculée pour ladite source. - Output means, adapted to provide an identifier of at least one of the selected sources, with the anticipation value calculated for said source.
12. Module de recherche automatique (1 ) selon la revendication 1 1 , dans lequel les moyens de production de la requête d'interrogation (RQ) sont adaptés pour permettre à un utilisateur (U) de saisir plusieurs événements (EV-i , EV2,...), et adaptés en outre pour produire la requête d'interrogation à partir des événements saisis, et les moyens de calcul sont adaptés pour déterminer chaque devancement temporel, pour une source sélectionnée qui a produit un contenu relatif à plusieurs des événements, comme une différence entre la date d'un des événements et une date à laquelle ladite source a produit un contenu relatif audit événement, et dont la référence a été collectée par les moyens de collecte. 12. automatic search module (1) according to claim 1 1, wherein the means for producing the query query (RQ) are adapted to allow a user (U) to enter multiple events (EV-i, EV 2 , ...), and further adapted to produce the query request from the events entered, and the computing means are adapted to determine each time advance, for a selected source that has produced a content relating to several of the events, such as a difference between the date of one of the events and a date that said source produced content relating to said event, and whose reference was collected by the collection means.
13. Module de recherche automatique (1 ) selon la revendication 1 1 , dans lequel les moyens de production de la requête d'interrogation (RQ) sont adaptés pour permettre à un utilisateur (U) de saisir un domaine d'intérêt, et le module de recherche automatique (1 ) comprend en outre des moyens de comptage adaptés pour compter, pour plusieurs dates, des contenus qui ont été produits à chacune desdites dates, et dont les références ont été collectées par le module de collecte, puis pour déterminer celles desdites dates auxquelles des plus grands nombres desdits contenus ont été produits, chaque date ainsi déterminée étant associée à un des événements, et les moyens de calcul sont adaptés pour déterminer chaque devancement temporel, pour une source sélectionnée par les moyens de sélection, comme une différence entre l'une des dates auxquelles a été produit un plus grand nombre de contenus dont les références ont été collectées par les moyens de collecte, et une date à laquelle ladite source a produit un contenu dont la référence a aussi été collectée par les moyens de collecte. 13. automatic search module (1) according to claim 1 1, wherein the means for producing the query query (RQ) are adapted to allow a user (U) to enter a field of interest, and the automatic search module (1) further comprises counting means adapted to count, for several dates, contents that were produced at each of said dates, and whose references were collected by the collection module, then to determine those said dates at which larger numbers of said contents have been produced, each date thus determined being associated with one of the events, and the calculation means are adapted to determine each time advance, for a source selected by the selection means, as a difference between one of the dates on which a greater number of contents whose references have been collected by the means of collection, and a date on which said source has produced content whose reference has also been collected by the collection means.
14. Module de recherche automatique (1 ) selon l'une quelconque des revendications 1 1 à 13, ledit module de recherche automatique étant adapté en outre pour exécuter un procédé qui est conforme à l'une quelconque des revendications 4 à 10. 14. Automatic search module (1) according to any one of claims 1 1 to 13, said automatic search module being further adapted to perform a method that is according to any one of claims 4 to 10.
15. Produit programme d'ordinateur, comprenant des codes adaptés pour produire une exécution d'un procédé conforme à l'une quelconque des revendications 1 à 10, lorsque lesdits codes sont lus et exécutés par au moins un processeur, et que ledit au moins un processeur a un accès à ladite au moins une base de données (BD). A computer program product, comprising codes adapted to produce an execution of a method according to any one of claims 1 to 10, when said codes are read and executed by at least one processor, and said at least one a processor has access to said at least one database (BD).
PCT/FR2017/053433 2016-12-20 2017-12-07 Identification of an information source WO2018115626A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1662830A FR3060801B1 (en) 2016-12-20 2016-12-20 IDENTIFYING A SOURCE OF INFORMATION
FR1662830 2016-12-20

Publications (1)

Publication Number Publication Date
WO2018115626A1 true WO2018115626A1 (en) 2018-06-28

Family

ID=58669891

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2017/053433 WO2018115626A1 (en) 2016-12-20 2017-12-07 Identification of an information source

Country Status (2)

Country Link
FR (1) FR3060801B1 (en)
WO (1) WO2018115626A1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110289422A1 (en) * 2010-05-21 2011-11-24 Live Matrix, Inc. Interactive calendar of scheduled web-based events and temporal indices of the web that associate index elements with metadata
US20160034712A1 (en) * 2012-10-02 2016-02-04 Banjo, Inc. System and method for event-related content discovery, curation, and presentation

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110289422A1 (en) * 2010-05-21 2011-11-24 Live Matrix, Inc. Interactive calendar of scheduled web-based events and temporal indices of the web that associate index elements with metadata
US20160034712A1 (en) * 2012-10-02 2016-02-04 Banjo, Inc. System and method for event-related content discovery, curation, and presentation

Also Published As

Publication number Publication date
FR3060801B1 (en) 2022-08-19
FR3060801A1 (en) 2018-06-22

Similar Documents

Publication Publication Date Title
JP6827515B2 (en) Viewing time clustering for video search
Tatar et al. From popularity prediction to ranking online news
US9953063B2 (en) System and method of providing a content discovery platform for optimizing social network engagements
US20180046957A1 (en) Online Meetings Optimization
WO2014008866A1 (en) System and method for indexing, ranking, and analyzing web activity within event driven architecture
FR2960084A1 (en) METHOD FOR CLASSIFYING THE INFLUENCE OF A WEBSITE
KR20160057475A (en) System and method for actively obtaining social data
CN109074366B (en) Gain adjustment component for computer network routing infrastructure
FR3043816B1 (en) METHOD FOR SUGGESTION OF CONTENT EXTRACTED FROM A SET OF INFORMATION SOURCES
FR2973906A1 (en) METHOD FOR SETTING PERSONAL DATA DISSEMINATION RULES
Fiaidhi et al. Thick data: A new qualitative analytics for identifying customer insights
Chakraborty et al. Optimizing the recency-relevance-diversity trade-offs in non-personalized news recommendations
Bastos et al. What sticks with whom? Twitter follower-followee networks and news classification
US20240080280A1 (en) Understanding social media user behavior
WO2018115626A1 (en) Identification of an information source
EP2834757B1 (en) Method and device for rapid provision of information
CN115550304B (en) Method, apparatus and storage medium for determining a set of active instances for a group of users
KR101568800B1 (en) Real-time issue search word sorting method and system
WO2018024999A1 (en) Means for broadcasting a personalized content in a communication network
FR3030079A1 (en) MEANS FOR DETERMINING A LEVEL OF RELEVANCE OF A RESOURCE IN AN INFORMATION PROCESSING SYSTEM
Singh Predicting the popularity of online news using social features
US20200042858A1 (en) Understanding social media user behavior
Hashemi et al. GroupRank: Ranking Online Social Groups Based on User Membership Records
WO2017064446A1 (en) Method of communication between two users, system using such a method
US20200043039A1 (en) Understanding social media user behavior

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17821973

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17821973

Country of ref document: EP

Kind code of ref document: A1