PROCÉDÉ DE FOURNITURE D’UNE INFORMATION PERTINENTE ASSOCIÉE À UN PROCESS FOR PROVIDING RELEVANT INFORMATION ASSOCIATED WITH A
BREVET PATENT
DOMAINE TECHNIQUE DE L’INVENTION TECHNICAL FIELD OF THE INVENTION
La présente invention vise un procédé de fourniture de fourniture d’une information pertinente associée à un brevet. Elle s’applique, notamment, la recherche dans des bases de données et à l’enrichissement de requêtes dans des bases de données de brevets avec des données statistiques nationales. De plus, la présente invention s’applique à la détection automatique de comportements d’utilisateurs en matière d’extensions de brevets. The present invention relates to a method of providing and providing relevant information associated with a patent. It applies, in particular, to searching databases and to enriching queries in patent databases with national statistical data. In addition, the present invention is applicable to the automatic detection of user behavior in relation to patent extensions.
ÉTAT DE LA TECHNIQUE STATE OF THE ART
Le compartimentage d’informations de types différents entraîne des difficultés de mise en relation par un utilisateur désireux de croiser des sources distinctes pour accroître sa connaissance d’un sujet. The compartmentalization of information of different types leads to difficulties in connecting a user wishing to cross different sources to increase his knowledge of a subject.
De ce compartimentage résulte un risque d’absence d’identification d’une information d’une première source par l’utilisateur lorsqu’il réalise une recherche d’informations à partir d’informations issues d’une deuxième source. Il résulte, de plus, un risque d’identification d’une mauvaise information ou d’une information moins pertinente que possible en raison de choix de l’utilisateur dans la recherche de l’information. Enfin, il résulte de manière évidente d’une perte de temps liée à la recherche par l’utilisateur qui doit analyser une information d’une première source pour identifier un critère de recherche dans une deuxième source, réaliser la recherche, trier les résultats avant d’en sélectionner un. This compartmentalization results in a risk of the user failing to identify information from a first source when performing a search for information from information from a second source. In addition, there is a risk of identifying incorrect information or information that is less relevant than possible due to the user's choice in the search for information. Finally, it obviously results from a waste of time related to the search by the user who must analyze information from a first source to identify a search criterion in a second source, perform the search, sort the results before select one.
Les bases de données répertoriant les brevets d’invention ne sont pas reliées aux bases de données d’informations statistiques relatives aux pays, telles par exemple des informations de type macro-économiques, dès que ces informations ne sont pas directement liées aux statistiques traitant des brevets. Il découle, de cette compartimentation de l’information, une difficulté à articuler les informations de type brevets aux autres informations pourtant nécessaires dans l’élaboration d’un choix stratégique lié aux brevets. Un tel choix est, par exemple, l’extension géographique d’une demande de brevet sous couvert du droit de priorité ou lors d’une sortie de demande PCT. Un tel choix requiert le croisement d’informations représentatives du potentiel de marché de la demande de brevet, de données budgétaires. The databases listing patents for inventions are not linked to databases of statistical information relating to countries, such as, for example, macroeconomic information, as soon as this information is not directly linked to statistics dealing with patents. This compartmentalization of information makes it difficult to link patent-type information to other information that is nevertheless necessary in the development of a strategic choice related to patents. One such choice is, for example, the geographical extension of a patent application under cover of the right of priority or upon exiting a PCT application. Such a choice requires the crossing of information representative of the market potential of the patent application, with budgetary data.
EXPOSÉ DE L’INVENTION STATEMENT OF THE INVENTION
La présente invention vise à remédier à tout ou partie de ces inconvénients. The present invention aims to remedy all or part of these drawbacks.
À cet effet, la présente invention vise un procédé de fourniture d’une information pertinente associée à un brevet comportant une étape de saisie d’au moins un identifiant de brevet d’invention, qui comporte : To this end, the present invention relates to a method for providing relevant information associated with a patent comprising a step of entering at least one invention patent identifier, which comprises:
- une étape de conversion de l’identifiant saisi en un premier ensemble de mots-clés représentatifs d’au moins un domaine technique du brevet, dans une première base de données associant au moins un identifiant à un ensemble de mots-clés ;
- une étape de création d’une requête de collecte d’informations représentatives d’un jeu de statistiques nationales, accessibles sur un réseau, en fonction des mots-clés résultant de la conversion et, pour chaque dite information, un deuxième ensemble de mots-clés associés à ladite information,a step of converting the identifier entered into a first set of keywords representative of at least one technical field of the patent, in a first database associating at least one identifier with a set of keywords; - a step of creating a request for collecting information representative of a set of national statistics, accessible on a network, according to the keywords resulting from the conversion and, for each said information, a second set of words -keys associated with said information,
- une étape de comparaison du premier ensemble de mots-clés et de chaque deuxième ensemble, - a step of comparing the first set of keywords and each second set,
- une étape d’affectation d’un poids à chaque information représentative du jeu de statistiques nationales collectée en fonction du résultat de la comparaison, - a step of assigning a weight to each piece of information representative of the set of national statistics collected according to the result of the comparison,
- une étape de hiérarchisation du jeu de statistiques nationales en fonction du poids de chaque dite information, - a stage of prioritization of the set of national statistics according to the weight of each said information,
- une étape de sélection d’au moins un jeu de statistiques nationales parmi les jeux de statistiques nationales hiérarchisées et - a step of selecting at least one set of national statistics among the sets of hierarchical national statistics and
- une étape de fourniture de chaque dite statistique nationale du jeu de statistiques nationales sélectionnée. - a step of supplying each said national statistic of the selected set of national statistics.
Grâce à ces dispositions, une requête, dans une base de données de brevet, est enrichie, en fonction de mots-clés associés au brevet de statistiques nationales, supranationales ou infranationales correspondantes, de manière automatique et fiable de sorte qu’un utilisateur puisse recevoir rapidement des informations fiables. De telles informations permettent, notamment, d’effectuer un choix avisé d’extension internationale d’une demande de brevet, par exemple. Thanks to these provisions, a query, in a patent database, is enriched, based on keywords associated with the patent of corresponding national, supranational or subnational statistics, automatically and reliably so that a user can receive quickly reliable information. Such information makes it possible, in particular, to make an informed choice of the international extension of a patent application, for example.
Dans des modes de réalisation, le procédé objet de la présente invention comporte, en amont de l’étape de saisie, une étape de construction de la première base de données qui comporte : In some embodiments, the method that is the subject of the present invention comprises, upstream of the input step, a step of constructing the first database which comprises:
- une étape de collecte et d’indexation d’identifiants publics d’au moins un brevet et - a step of collecting and indexing public identifiers of at least one patent and
- une étape d’association, à chaque brevet dont les données publiques sont indexées, au moins une information représentative d’au moins un mot-clé. - an association step, for each patent whose public data is indexed, at least one piece of information representative of at least one keyword.
Ces modes de réalisation permettent de créer une nouvelle base de données de recherche utilisant les données publiques disponibles associées à des mots-clés pertinents en matière de domaine technique de l’invention. These embodiments create a new search database using publicly available data associated with keywords relevant to the technical field of the invention.
Dans des modes de réalisation, l’information est représentative d’au moins un intitulé d’une classe technique associé à un ensemble de mots-clés. In some embodiments, the information is representative of at least one title of a technical class associated with a set of keywords.
Ces modes de réalisation permettent de déduire d’une classe internationale ou coopérative de brevets des mots-clés représentant techniquement le domaine d’application du brevet recherché. De tels mots-clés peuvent être associés via une table de correspondance, par exemple. These embodiments make it possible to deduce from an international or cooperative class of patents keywords which technically represent the field of application of the sought patent. Such keywords can be associated via a correspondence table, for example.
Dans des modes de réalisation, l’information est représentative d’au moins une partie du contenu du brevet. In some embodiments, the information is representative of at least part of the content of the patent.
Grâce à ces dispositions, les mots-clés sont déduits du contenu du brevet pour correspondre plus précisément au brevet concerné. Le contenu peut ici faire référence à la description, aux revendications ou à l’abrégé, par exemple. Thanks to these provisions, the keywords are deduced from the content of the patent to correspond more precisely to the patent concerned. The content here may refer to the description, claims or abstract, for example.
Dans des modes de réalisation, l’étape de construction de la première base de données comporte une étape de création d’une arborescence, reliant au moins deux identifiants de brevets, l’information représentative d’au moins un mot-clé étant associée en fonction de chaque identifiant relié à l’identifiant saisi lors de l’étape de saisie.
Ces modes de réalisation permettent de lier des brevets par famille de brevets, par exemple en fonction d’une priorité revendiquée selon la convention de l’union de Paris. Des familles de brevets peuvent donc être créées, les informations contenues dans la base de données d’un brevet pouvant enrichir une requête formulée en ce qui concerne un brevet de la même famille. In some embodiments, the step of constructing the first database comprises a step of creating a tree structure, linking at least two patent identifiers, the information representative of at least one keyword being associated in function of each identifier linked to the identifier entered during the entry step. These embodiments make it possible to link patents by patent family, for example according to a priority claimed according to the Paris Union convention. Patent families can therefore be created, the information contained in the database of a patent being able to enrich a request formulated concerning a patent of the same family.
Dans des modes de réalisation, le procédé objet de la présente invention qui comporte une étape d’extrapolation d’une statistique nationale d’un jeu de statistiques nationales présentant une statistique nationale manquante, chaque valeur obtenue par extrapolation étant associée au deuxième ensemble de mots-clés de l’information représentative du jeu de statistiques nationales de la valeur extrapolée. In embodiments, the method that is the subject of the present invention which comprises a step of extrapolating a national statistic from a set of national statistics having a missing national statistic, each value obtained by extrapolation being associated with the second set of words -keys of information representative of the set of national statistics of the extrapolated value.
Ces modes de réalisation permettent d’extrapoler des statistiques nationales si une ou plusieurs statistique nationale est manquante d’un jeu de statistiques nationales. These embodiments make it possible to extrapolate from national statistics if one or more national statistics is missing from a set of national statistics.
Dans des modes de réalisation, le procédé objet de la présente invention comporte une étape de construction de la deuxième base de données comportant : In some embodiments, the method that is the subject of the present invention comprises a step of constructing the second database comprising:
- une étape de collecte et d’indexation de jeux de statistiques nationales, - a stage of collecting and indexing sets of national statistics,
- une étape d’association, à chaque jeu de statistiques nationales indexé, au moins une information représentative d’au moins un mot-clé. - an association step, for each set of national statistics indexed, at least one piece of information representative of at least one keyword.
Ces modes de réalisation permettent de construire une base de données de statistiques nationales disparates. These embodiments make it possible to build a database of disparate national statistics.
Dans des modes de réalisation, les jeux de statistiques nationales sont organisés dans au moins une arborescence comportant au moins deux niveaux, un niveau dit « supérieur » auquel est rattaché un niveau dit « inférieur » comportant plusieurs jeux de statistiques nationales, le jeu de statistique nationale du niveau supérieur étant égal à la somme des jeux de valeurs du niveau inférieur. In some embodiments, the sets of national statistics are organized in at least one tree structure comprising at least two levels, a so-called “higher” level to which is attached a so-called “lower” level comprising several sets of national statistics, the set of statistics national level of the higher level being equal to the sum of the sets of values of the lower level.
Ces modes de réalisation permettent de faire correspondre une classification de brevets à une classification de données statistiques nationales. These embodiments make it possible to match a patent classification with a classification of national statistical data.
Dans des modes de réalisation, lors de l’étape d’extrapolation, une statistique nationale est extrapolée en fonction du jeu de statistiques nationales d’un niveau supérieur. In some embodiments, in the extrapolation step, a national statistic is extrapolated based on the set of higher level national statistics.
Grâce à ces dispositions, l’extrapolation de statistiques nationales est cohérente avec les autres jeux de statistiques nationales d’une même arborescence. Thanks to these provisions, the extrapolation of national statistics is consistent with other sets of national statistics in the same tree structure.
Dans des modes de réalisation, les jeux de statistiques nationales sont organisés selon deux arborescences distinctes, une statistique nationale d’une arborescence étant extrapolée en fonction d’un jeu de statistiques nationales d’une autre arborescence. In some embodiments, the sets of national statistics are organized in two distinct trees, with a national statistic from one tree being extrapolated based on a set of national statistics from another tree.
Ces modes de réalisation permettent d’extrapoler par rapport à d’autres jeux de statistiques nationales liées, mais dans deux arborescences distinctes. These embodiments allow extrapolating from other sets of related national statistics, but in two separate trees.
Dans des modes de réalisation, la première base de données comporte pour chaque brevet, une identification d’au moins un titulaire et un code représentatif de la portée géographique, le procédé comporte, de plus : In embodiments, the first database comprises for each patent, an identification of at least one holder and a code representative of the geographical scope, the method further comprises:
- une étape d’association d’au moins un autre brevet de la première base de données correspondant au premier ensemble de mots-clés de l’identifiant saisi et/ou au titulaire du titre, - a step of associating at least one other patent from the first database corresponding to the first set of keywords of the identifier entered and / or the holder of the title,
- une étape de décompte du nombre d’occurrences de chaque code représentatif de la portée géographique en fonction de chaque autre brevet associé brevet dont l’identifiant est saisi ; - a step of counting the number of occurrences of each code representative of the geographical scope according to each other associated patent patent whose identifier is entered;
- une étape de pondération de chaque statistique nationale du jeu de statistiques nationales sélectionné en fonction du nombre d’occurrences,
- lors de l’étape de fourniture, le jeu de statistiques nationales est classé par pondération décroissante. - a step of weighting each national statistic of the selected set of national statistics according to the number of occurrences, - during the supply stage, the set of national statistics is classified by decreasing weighting.
Grâce à ces dispositions, le comportement de gestionnaires dans des situations similaires est modélisé et permet de déduire, pour le gestionnaire en charge du titre de propriété industrielle étudié, une stratégie adéquate en fonction des comportements observés pour limiter les coûts et optimiser les décisions prises. Thanks to these provisions, the behavior of managers in similar situations is modeled and makes it possible to deduce, for the manager in charge of the industrial property title studied, an appropriate strategy based on the behavior observed to limit costs and optimize the decisions taken.
Dans des modes de réalisation, chaque statistique nationale est associée à une zone géographique de portée, le procédé comporte, de plus ; In embodiments, each national statistic is associated with a geographic area of scope, the method further comprising;
- une étape de définition d’une valeur limite prédéterminée, - a step of defining a predetermined limit value,
- une étape de classement de chaque statistique nationale du jeu de statistiques nationales sélectionné par zone géographique et par valeur décroissante, - a step of classifying each national statistic from the set of national statistics selected by geographic area and by decreasing value,
- une étape itérative de calcul de la somme de chaque statistique nationale, par ordre de classement, jusqu’à ce que la valeur de la somme soit supérieure ou égale à la valeur limite prédéterminée, et - an iterative step of calculating the sum of each national statistic, in order of classification, until the value of the sum is greater than or equal to the predetermined limit value, and
- lors de l’étape de fourniture, les statistiques nationales fournies sont les statistiques nationales utilisées lors de la dernière itération de l’étape de calcul. - during the supply step, the national statistics provided are the national statistics used in the last iteration of the calculation step.
Ces modes de réalisation permettent d’enrichir la requête avec des zones géographiques. These embodiments make it possible to enrich the query with geographic areas.
BRÈVE DESCRIPTION DES FIGURES BRIEF DESCRIPTION OF THE FIGURES
D’autres avantages, buts et caractéristiques particulières de l’invention ressortiront de la description non limitative qui suit d’au moins un mode de réalisation particulier du procédé objet de la présente invention, en regard des dessins annexés, dans lesquels : Other advantages, aims and particular characteristics of the invention will emerge from the non-limiting description which follows of at least one particular embodiment of the method which is the subject of the present invention, with reference to the accompanying drawings, in which:
- La figure 1 représente, schématiquement et sous forme d’un logigramme, une succession d’étapes particulière d’un premier mode de réalisation procédé objet de la présente invention, - Figure 1 shows, schematically and in the form of a flowchart, a succession of particular steps of a first embodiment of the method object of the present invention,
- La figure 2 représente, schématiquement et sous forme d’un logigramme, une succession d’étapes particulière d’un deuxième mode de réalisation procédé objet de la présente invention,- Figure 2 shows, schematically and in the form of a flowchart, a succession of particular steps of a second method embodiment of the present invention,
- La figure 3 représente, schématiquement et sous forme d’un logigramme, une succession d’étapes particulière d’un troisième mode de réalisation procédé objet de la présente invention,- Figure 3 shows, schematically and in the form of a flowchart, a succession of particular steps of a third method embodiment of the present invention,
- La figure 4 représente, schématiquement et sous forme d’un logigramme, une succession d’étapes particulière d’un quatrième mode de réalisation procédé objet de la présente invention,- Figure 4 shows, schematically and in the form of a flowchart, a succession of particular steps of a fourth method embodiment of the present invention,
- La figure 5 représente, schématiquement, une représentation graphique des objets manipulés par le procédé objet de la présente invention. FIG. 5 represents, schematically, a graphic representation of the objects handled by the method which is the subject of the present invention.
DESCRIPTION D’EXEMPLES DE RÉALISATION DE L’INVENTION DESCRIPTION OF EXAMPLES OF EMBODIMENT OF THE INVENTION
La présente description est donnée à titre non limitatif, chaque caractéristique d’un mode de réalisation pouvant être combinée à toute autre caractéristique de tout autre mode de réalisation de manière avantageuse. This description is given without limitation, each characteristic of an embodiment being able to be combined with any other characteristic of any other embodiment in an advantageous manner.
On note dès à présent que les figures ne sont pas à l’échelle. We now note that the figures are not to scale.
On note, ici, que le terme « brevet » désigne à la fois une demande de brevet, un brevet délivré, un certificat d’utilité et tout autre titre de propriété industrielle classifié selon l’une des classifications techniques de brevets, parmi lesquelles notamment la CIB (pour « Classification Internationale des
Brevets ») et la CCB (pour « Classification Coopérative des Brevets », connue en anglais sous le sigle CPC, pour « Cooperative Patent Classification »). It is noted here that the term "patent" designates both a patent application, a granted patent, a utility certificate and any other industrial property title classified according to one of the technical classifications of patents, among which in particular the IPC (for "International Classification of Patents ”) and the CCB (for“ Cooperative Patent Classification ”, known in English under the acronym CPC, for“ Cooperative Patent Classification ”).
On note que le terme « statistiques nationales » se réfère à toute donnée caractérisant un pays ou un groupement de pays. Cette donnée peut être représentative d’une activité économique, d’un état politique ou juridique ou représentative de la population d’un pays par exemple. Ces exemples sont donnés à titre non limitatifs. Par extension, un jeu de statistiques nationales est un ensemble de valeurs numériques représentant une même entité, sur plusieurs périodes temporelles et/ou zones géographiques. On note qu’une période temporelle est une durée de longueur prédéfinie, par exemple une année ou un mois. On note également qu’une zone géographique est définie par la délimitation des frontières d’un pays ou d’un groupement de pays. It should be noted that the term “national statistics” refers to any data characterizing a country or a group of countries. This data can be representative of an economic activity, a political or legal state or representative of the population of a country for example. These examples are given without limitation. By extension, a set of national statistics is a set of numerical values representing the same entity, over several time periods and / or geographic areas. Note that a time period is a duration of predefined length, for example a year or a month. We also note that a geographical area is defined by the demarcation of the borders of a country or a group of countries.
On appelle « apprentissage automatique » toute technologie d’approche statistique permettant à un programme d’ordinateur d’améliorer sa performance pour résoudre une tâche sans que cette augmentation de performance soit le fait d’une programmation explicite. L’apprentissage automatique considéré peut mettre en oeuvre tout algorithme connu de l’Homme du Métier pour parvenir à l’objectif pour lequel il est appliqué. "Machine learning" is any statistical approach technology that allows a computer program to improve its performance in solving a task without this increase in performance being the result of explicit programming. The machine learning considered can implement any algorithm known to those skilled in the art to achieve the objective for which it is applied.
On note que le premier et le deuxième terminal informatique peuvent être confondus. It is noted that the first and the second computer terminal can be confused.
On observe, sur la figure 1 , un logigramme d’étapes d’un premier mode de réalisation particulier du procédé 10 objet de la présente invention. Le procédé 10 de fourniture d’une information pertinente associée à un brevet qui comporte une étape de saisie 1 1 d’au moins un identifiant de brevet d’invention, comporte : FIG. 1 shows a flowchart of steps of a first particular embodiment of the method 10 which is the subject of the present invention. The method 10 of providing relevant information associated with a patent which comprises a step 11 of entering at least one invention patent identifier, comprises:
- une étape de conversion 12 de l’identifiant saisi en un premier ensemble de mots-clés représentatifs d’au moins un domaine technique du brevet, dans une première base de données associant au moins un identifiant à un ensemble de mots-clés ; - a conversion step 12 of the identifier entered into a first set of keywords representative of at least one technical field of the patent, in a first database associating at least one identifier with a set of keywords;
- une étape de création 13 d’une requête de collecte d’informations représentatives d’un jeu de statistiques nationales, accessibles sur un réseau, en fonction des mots-clés résultant de la conversion et, pour chaque dite information, un deuxième ensemble de mots-clés associés à ladite information, a step 13 of creating a request for collecting information representative of a set of national statistics, accessible on a network, as a function of the keywords resulting from the conversion and, for each said information, a second set of keywords associated with said information,
- une étape de comparaison 14 du premier ensemble de mots-clés et de chaque deuxième ensemble, - a comparison step 14 of the first set of keywords and of each second set,
- une étape d’affectation 15 d’un poids à chaque information représentative du jeu de statistiques nationales collectée en fonction du résultat de la comparaison, - a step 15 of assigning a weight to each piece of information representative of the set of national statistics collected according to the result of the comparison,
- une étape de hiérarchisation 16 du jeu de statistiques nationales en fonction du poids de chaque dite information, - a step 16 of prioritizing the set of national statistics according to the weight of each said information,
- une étape de sélection 17 d’au moins un jeu de statistiques nationales parmi les jeux de statistiques nationales hiérarchisées et - a selection step 17 of at least one set of national statistics from among the sets of hierarchical national statistics and
- une étape de fourniture 18 de chaque dite statistique nationale du jeu de statistiques nationales sélectionnée. a step 18 of providing each said national statistic of the selected set of national statistics.
L’étape de saisie 1 1 est effectuée au moyen d’un premier terminal informatique comportant une interface homme/machine, par exemple un clavier ou un écran tactile. Lors de l’étape de saisie 1 1 un opérateur insère dans un champ de saisie une suite de caractères alphanumériques représentant un identifiant d’un brevet. Un opérateur saisit, par exemple, un numéro de demande ou de publication d’un brevet. Par exemple, l’identifiant du brevet peut être un code composé de deux lettres représentatives
d’une zone géographique et d’un ensemble de caractères numériques représentatifs d’un numéro de demande. The input step 11 is carried out by means of a first computer terminal comprising a man / machine interface, for example a keyboard or a touch screen. During the entry step 11, an operator inserts into an entry field a series of alphanumeric characters representing an identifier of a patent. An operator enters, for example, a patent application or publication number. For example, the patent identifier can be a code consisting of two representative letters a geographical area and a set of numerical characters representative of an application number.
Dans des modes de réalisation, l’identifiant correspond au numéro de publication, au numéro de dépôt ou au numéro de délivrance d’un brevet ou d’une demande de brevet. Préférentiellement, chaque titre de propriété industrielle de la première base de données comporte un champ représentatif de la zone géographique, pays ou région, couverte par le titre. La forme d’un identifiant de brevet est connue de l’homme du métier. L’étape de saisie 1 1 peut comporter une étape d’affichage d’une saisie prédictive (autrement appelée « saisie intuitive ») connue de l’homme du métier. In some embodiments, the identifier corresponds to the publication number, filing number or grant number of a patent or patent application. Preferably, each industrial property title in the first database comprises a field representative of the geographical area, country or region, covered by the title. The form of a patent identifier is known to those skilled in the art. The input step 11 may include a step of displaying a predictive input (otherwise called "intuitive input") known to those skilled in the art.
Lors de l’étape de conversion 12, l’identifiant saisi est associé à au moins un mot-clé dans la première base de données. La construction de la première base de données est décrite en regard du logigramme de la figure 2. During conversion step 12, the identifier entered is associated with at least one keyword in the first database. The construction of the first database is described with reference to the flowchart in Figure 2.
L’étape de construction 21 de la première base de données comporte : The construction step 21 of the first database comprises:
- une étape de collecte 22 et d’indexation d’identifiants publics d’au moins un brevet et - a step of collecting 22 and indexing public identifiers of at least one patent and
- une étape d’association 23, à chaque brevet dont les données publiques sont indexées, au moins une information représentative d’au moins un mot-clé. - an association step 23, for each patent whose public data is indexed, at least one piece of information representative of at least one keyword.
L’étape de collecte 22 est réalisée, par exemple, par la mise en oeuvre d’un circuit électronique de calcul, de type ordinateur ou serveur informatique, configuré pour recevoir via un moyen de communication, telle une carte réseau par exemple, des identifiants publics de brevets. The collection step 22 is carried out, for example, by the implementation of an electronic calculation circuit, of the computer or computer server type, configured to receive, via a means of communication, such as a network card for example, identifiers. patent public.
Lors de l’étape de collecte 22 et d’indexation, plusieurs bases de données de brevets publiques de brevets sont collectées et assemblées. Chaque brevet est défini par une donnée informatique représentative d’un identifiant unique. In the collection step 22 and indexing, several public patent patent databases are collected and assembled. Each patent is defined by computer data representative of a unique identifier.
Dans des modes de réalisation, le procédé objet de la présente invention comporte une pluralité d’étapes de collecte 22 de données. Une telle pluralité d’étapes de collecte 22 peut correspondre soit à la collecte successive d’un type de données identique et/ou à un la collecte de plusieurs types de données distinctes. In some embodiments, the method that is the subject of the present invention comprises a plurality of data collection steps 22. Such a plurality of collection steps 22 may correspond either to the successive collection of an identical type of data and / or to the collection of several different types of data.
Préférentiellement, chaque brevet est associé à au moins une des caractéristiques suivantes : Preferably, each patent is associated with at least one of the following characteristics:
- une donnée informatique représentative d’un titulaire du titre dite « titulaire », - computer data representative of a holder of the so-called "holder" title,
- une donnée informatique représentative d’au moins une classe technique dite « classe », - IT data representative of at least one technical class called "class",
- un mandataire, - an agent,
- un numéro de priorité, - a priority number,
- une date de priorité, - a priority date,
- l’identification d’au moins un inventeur, - the identification of at least one inventor,
- une date de dépôt, - a filing date,
- un numéro de dépôt, - a deposit number,
- une date de publication, - a date of publication,
- un numéro de publication, - a publication number,
- un titre, - a title,
- au moins un document cité dans la procédure d’examen du brevet, - at least one document cited in the patent examination procedure,
- un abrégé, - an abstract,
- une description, - a description,
- au moins une revendication et/ou
- de toute autre information connue de l’homme du métier et présente sur au moins base de données de titres de propriété industrielle. - at least one claim and / or - any other information known to those skilled in the art and present on at least industrial property title database.
La donnée informatique représentative d’un titulaire peut représenter, un nom, une adresse, un numéro de téléphone, une forme juridique, un numéro d’identification unique délivré par une administration gouvernementale, et/ou toute autre information représentative d’une entreprise ou d’un particulier. The computer data representative of a holder may represent a name, an address, a telephone number, a legal form, a unique identification number issued by a government administration, and / or any other information representative of a company or from an individual.
Chaque donnée informatique représentative d’au moins une classe technique peut correspondre à un élément d’une classification de brevets telles la « Classification coopérative des brevets » (d’acronyme « CPC ») ou la « Classification internationale des brevets » (d’acronyme « CIB »). Chaque code représentatif d’un domaine technique de la CPC et de la CIB comporte au moins, dans l’ordre suivant : Each computer data representative of at least one technical class may correspond to an element of a patent classification such as the "Cooperative Patent Classification" (acronym "CPC") or the "International Patent Classification" (acronym "CIB"). Each code representative of a technical area of the CPC and the IPC comprises at least, in the following order:
- une lettre représentative d’une section, - a letter representing a section,
- deux chiffres représentatifs d’une classe, - two digits representative of a class,
- une deuxième lettre représentative d’une sous-classe, - a second letter representative of a subclass,
- au moins un chiffre représentatif d’un groupe. - at least one figure representative of a group.
Dans des modes de réalisation, chaque code comporte de plus, au moins deux autres chiffres séparés de chaque chiffre représentatif d’un groupe par le symbole « / ». Lesdits deux autres chiffres représentent un sous-groupe. Par exemple, la chaîne alphanumérique d’une donnée représentative d’une classe technique serait « A21 C1 /06 ». In some embodiments, each code further comprises at least two other digits separated from each representative digit of a group by the symbol "/". Said two other digits represent a subgroup. For example, the alphanumeric string of a data representative of a technical class would be "A21 C1 / 06".
L’étape d’association 23 est réalisée, par exemple, par la mise en oeuvre d’un circuit électronique de calcul, de type ordinateur ou serveur informatique, configuré pour associer directement ou indirectement au moins un mot-clé à un identifiant de brevet. Une association indirecte est réalisée, par exemple, par l’association d’un indicateur de classe technique correspondant, via une table de correspondance, à un ensemble de mots-clés. The association step 23 is carried out, for example, by the implementation of an electronic calculation circuit, of the computer or computer server type, configured to directly or indirectly associate at least one keyword with a patent identifier. . An indirect association is achieved, for example, by associating a corresponding technical class indicator, via a correspondence table, with a set of keywords.
Dans des modes de réalisation, lors de l’étape d’association 23, l’information est représentative d’au moins un intitulé d’une classe technique associé à un ensemble de mots-clés. Par exemple, la classe technique est associée, dans une autre base de données à un intitulé. Des mots-clés peuvent être extraits dudit intitulé. In some embodiments, during the association step 23, the information is representative of at least one title of a technical class associated with a set of keywords. For example, the technical class is associated in another database with a title. Keywords can be extracted from said title.
Dans des modes de réalisation, l’information est représentative d’au moins une partie du contenu du brevet. Par exemple, l’information est représentative d’au moins une partie d’une revendication, de l’agrégé, du titre ou de la description. In some embodiments, the information is representative of at least part of the content of the patent. For example, the information is representative of at least part of a claim, aggregate, title or description.
Dans des modes de réalisation, l’information est représentative d’au moins une activité d’au moins un titulaire. Par exemple, chaque titulaire est associé à un domaine économique d’activité dans une autre base de données. Le domaine technique d’activité peut être représenté par un code selon la nomenclature d’activité française (d’acronyme « NAF ») ou tout équivalent dans d’autres pays. In embodiments, the information is representative of at least one activity of at least one holder. For example, each holder is associated with an economic area of activity in another database. The technical field of activity can be represented by a code according to the French nomenclature of activity (acronym "NAF") or any equivalent in other countries.
Dans des modes de réalisation, l’information est représentative d’une combinaison des informations ci-dessus. In some embodiments, the information is representative of a combination of the above information.
Dans des modes de réalisation, l’étape de construction 20 comporte une étape de création 24 d’une arborescence, reliant au moins deux identifiants de brevets, l’information représentative d’au moins un mot-clé étant associée en fonction de chaque identifiant relié à l’identifiant saisi lors de l’étape de saisie.
L’étape de construction 24 est réalisée, par exemple, par la mise en œuvre d’un circuit électronique de calcul, de type ordinateur ou serveur informatique, configuré pour associer en base de données plusieurs identifiants de brevets selon une règle déterminée. In some embodiments, the construction step 20 comprises a step of creation 24 of a tree structure, connecting at least two patent identifiers, the information representative of at least one keyword being associated according to each identifier. linked to the identifier entered during the entry step. The construction step 24 is carried out, for example, by the implementation of an electronic calculation circuit, of the computer or computer server type, configured to associate several patent identifiers in a database according to a determined rule.
Dans des modes de réalisation, un ou plusieurs brevets peuvent être cités lors de la procédure de délivrance du brevet dont l’identifiant est saisi, reliant lesdits brevets au brevet dont l’identifiant a été saisi. Chacun desdits brevets est identifié par un identifiant unique associé à une information représentative d’au moins un mot-clé. Dans des modes de réalisation, deux identifiants de brevet sont reliés par au moins une revendication de priorité commune, ou par un titulaire commun, par exemple. In embodiments, one or more patents may be cited during the process of granting the patent whose identifier is seized, linking said patents to the patent whose identifier has been seized. Each of said patents is identified by a unique identifier associated with information representative of at least one keyword. In embodiments, two patent identifiers are linked by at least one common priority claim, or by a common owner, for example.
Dans des modes de réalisation particuliers, tel que celui représenté en figure 2, le procédé 20 comporte, en amont de l’étape de conversion 12, une étape de lecture d’une donnée représentative d’un contenu du brevet, l’étape de conversion 12 étant réalisée en fonction des données lues. In particular embodiments, such as that shown in FIG. 2, the method 20 comprises, upstream of the conversion step 12, a step of reading a data item representative of a content of the patent, the step of conversion 12 being performed as a function of the data read.
Une telle étape de lecture peut être réalisée, par exemple, par la mise en œuvre d’un circuit électronique de calcul configuré pour exécuter un programme informatique de lecture de documents. Such a reading step can be carried out, for example, by implementing an electronic calculation circuit configured to execute a computer program for reading documents.
Cette donnée représentative est, par exemple, un texte représentatif de l’abrégé du brevet sur une base de données, tel un registre de brevets. Ce contenu textuel est alors, par exemple, ajouté au premier ensemble de mots-clés, de sorte quel le calcul est alors lié au brevet qui contextualise la classe à l’application visée par le brevet. This representative data is, for example, a representative text of the abstract of the patent on a database, such as a patent register. This textual content is then, for example, added to the first set of keywords, so that the calculation is then linked to the patent which contextualizes the class to the application covered by the patent.
Lors de l’étape de conversion 12, chaque information représentative d’au moins un mot-clé est obtenue par consultation de la première base de données. Puis, au moins un mot-clé associé à l’information est obtenu. Préférentiellement, chaque mot-clé obtenu est intégré au premier ensemble de mots-clés. L’étape de conversion 12 est réalisée, par exemple, par le serveur informatique dans une base de données associant, pour au moins un identifiant de brevet au moins une classe technique. Cette base de données est, par exemple, un registre de brevets en ligne, tels, par exemple, le registre français des brevets tenu par IΊNRI (pour « Institut National de la Propriété Industrielle »), le registre européen des brevets tenu par l’OEB (pour « Office Européen des Brevets ») ou le registre des brevets des États-Unis d’Amérique tenu par l’USPTO (pour « United States Patent and Trademarks Office », traduit par Office des Brevets et des Marques des États-Unis). Cette base de données est, préférentiellement, la base DocDB tenue par l’OEB. During the conversion step 12, each piece of information representative of at least one keyword is obtained by consulting the first database. Then, at least one keyword associated with the information is obtained. Preferably, each keyword obtained is integrated into the first set of keywords. The conversion step 12 is performed, for example, by the computer server in a database associating, for at least one patent identifier, at least one technical class. This database is, for example, an online patent register, such as, for example, the French register of patents kept by IΊNRI (for "National Institute of Industrial Property"), the European patent register kept by the EPO (for "European Patent Office") or the United States Patent Register kept by the USPTO (for "United States Patent and Trademarks Office", translated by the United States Patent and Trademarks Office ). This database is preferably the DocDB database maintained by the EPO.
Dans des modes de réalisation, l’étape de conversion comporte une étape de suppression des doublons du premier ensemble de mots-clés. In some embodiments, the converting step includes a step of removing duplicates from the first set of keywords.
Dans des modes de réalisation, au moins un mot-clé pour lequel l’information représentative est au moins un élément parmi une partie d’une revendication, du titre, de l’abrégé et/ou de la description est extrait dudit élément. In embodiments, at least one keyword for which the representative information is at least one of a part of a claim, title, abstract and / or description is extracted from said element.
Dans des modes de réalisation, au moins un mot-clé pour lequel l’information représentative est au moins une classe technique est extrait de l’intitulé de la classe technique. In embodiments, at least one keyword for which the representative information is at least one technical class is taken from the title of the technical class.
Dans des modes de réalisation, au moins un mot-clé est associé à une valeur de pertinence, cette valeur de pertinence étant calculée par analyse sémantique et/ou statistique des mots-clés candidats à la conversion. In some embodiments, at least one keyword is associated with a relevance value, this relevance value being calculated by semantic and / or statistical analysis of the candidate keywords for conversion.
Dans des modes de réalisation dans lesquels une arborescence est créée, l’ensemble de mots- clés comporte au moins partiellement les mots-clés d’un brevet dont l’identifiant est relié au brevet dont
l’identifiant est saisi. Il y a alors une accumulation des mots-clés pour plus de précision lors de la recherche. In embodiments in which a tree structure is created, the set of keywords at least partially comprises the keywords of a patent whose identifier is linked to the patent whose the identifier is entered. There is then an accumulation of keywords for more precision during the research.
Le procédé d’extraction de mots-clés est connu de l’homme du métier. The method of extracting keywords is known to those skilled in the art.
Le procédé 10 comporte une étape de création 13 d’une requête de collecte d’informations représentatives d’un jeu de statistiques nationales, accessibles sur un réseau, en fonction des mots- clés résultant de la conversion et, pour chaque dite information, un deuxième ensemble de mots-clés associés à ladite information. The method 10 comprises a step 13 of creating a request for collecting information representative of a set of national statistics, accessible on a network, as a function of the keywords resulting from the conversion and, for each said item of information, a second set of keywords associated with said information.
Une requête de collecte d’informations, aussi connue sous l’appellation « requête de recherche ». Lors de l’étape de création 13 d’une requête, le premier ensemble de mots-clés est utilisé par un moteur de recherche d’informations dans la deuxième base de données. Une requête est un ensemble de mots associés à des opérateurs logiques tels que « ET », « OU », ou encore « ET/OU ». Le moteur de recherche fouille dans les données à sa disposition pour recherche les mots en fonction des opérateurs logiques définis. A request to collect information, also known as a "search request". In step 13 of creating a query, the first set of keywords are used by an information search engine in the second database. A request is a set of words associated with logical operators such as “AND”, “OR”, or even “AND / OR”. The search engine searches the data at its disposal to find the words according to the defined logical operators.
Préférentiellement, lors de l’étape de création 13, l’ensemble de mots est associé à un opérateur « ET/OU », c’est-à-dire que l’ensemble des mots peut apparaître simultanément ou alternativement dans un champ de recherche. Preferably, during the creation step 13, the set of words is associated with an “AND / OR” operator, that is to say that the set of words can appear simultaneously or alternately in a search field. .
La deuxième base de données est détaillée en regard de l’étape de construction 31 représentée en figure 3. L’étape de construction 31 de la deuxième base de données comporte : The second database is detailed with regard to the construction step 31 shown in Figure 3. The construction step 31 of the second database comprises:
- une étape de collecte et d’indexation 32 de jeux de statistiques nationales,- a step of collecting and indexing 32 sets of national statistics,
- une étape d’association 33, à chaque jeu de statistiques nationales indexé, au moins une information représentative d’au moins un mot-clé. - an association step 33, for each set of national statistics indexed, at least one piece of information representative of at least one keyword.
L’étape 32 de collecte et d’indexation de jeux de statistiques nationales est réalisée, par exemple, par un opérateur humain consultant une base de données ouverte de données statistiques nationales et enregistrant tout ou partie des données accessibles sur un serveur informatique ou sur un terminal informatique, tel un ordinateur. Cette étape 32 de collecte peut également être automatique et réalisée par connexion d’un serveur informatique ou ordinateur de collecte à une base de données ouverte. Alternativement, des données statistiques nationales peuvent être saisies par un opérateur humain, via une interface homme-machine, sur un serveur informatique ou ordinateur de collecte. Step 32 of collecting and indexing sets of national statistics is performed, for example, by a human operator consulting an open database of national statistical data and recording all or part of the data accessible on a computer server or on a computer. computer terminal, such as a computer. This collection step 32 can also be automatic and carried out by connecting a computer server or collection computer to an open database. Alternatively, national statistical data can be entered by a human operator, via a man-machine interface, on a computer server or collection computer.
Chaque donnée statistique nationale ainsi collectée comporte, a minima, un ensemble de mots- clés associé à une valeur chiffrée. Par exemple, une donnée statistique nationale collectée est : « nombre de stéthoscopes vendus en Europe » associé au nombre 175 372. Each national statistical data thus collected comprises, at a minimum, a set of keywords associated with a numerical value. For example, a national statistical data collected is: “number of stethoscopes sold in Europe” associated with the number 175,372.
L’étape 14 de comparaison est réalisée, par exemple, par la mise en oeuvre informatique d’un algorithme de mesure de proximité lexicale et/ou sémantique entre deux ensembles de mots-clés. Un tel algorithme est, par exemple, un algorithme de mesure d’une distance : The comparison step 14 is carried out, for example, by the computer implementation of an algorithm for measuring lexical and / or semantic proximity between two sets of keywords. Such an algorithm is, for example, an algorithm for measuring a distance:
- de Hamming, - from Hamming,
- de Levenshtein, - from Levenshtein,
- de Damerau-Levenshtein, la distance d'édition et la distance d'édition avec transposition et/ou - from Damerau-Levenshtein, the edit distance and the edit distance with transposition and / or
- distance de Jaro-Winkler. - Jaro-Winkler distance.
Ces exemples de distances sont bien connus de l’art antérieur et du domaine de la fouille de texte, visent à évaluer la distance qui sépare deux chaînes de texte, tels les mots-clés de classe ou de données statistiques nationales par exemple.
Cette mesure de distance, ou d’indice de similarité à l’inverse, a lieu pour au moins une paire formée d’un ensemble, ou sous-ensemble, de mots-clés d’une classe et d’un ensemble, ou sous- ensemble, de mots-clés d’une donnée statistique nationale. These examples of distances are well known in the prior art and in the field of text mining, aim to evaluate the distance which separates two text strings, such as class keywords or national statistical data for example. This measurement of distance, or of similarity index on the contrary, takes place for at least one pair formed of a set, or subset, of keywords of a class and of a set, or sub - set of keywords of a national statistical data.
Les classes et jeux de statistiques nationales peuvent appartenir à une arborescence, dite classification, composée de nœuds et de branches. Deux telles arborescences sont illustrées en figure 5 : The classes and sets of national statistics can belong to a tree structure, called a classification, made up of nodes and branches. Two such trees are illustrated in figure 5:
- une classification 505 technique d’une part, - a technical 505 classification on the one hand,
- une classification 510 de données statistiques nationales d’autre part. - a 510 classification of national statistical data on the other hand.
La classification 505 technique est formée de deux niveaux de nœuds, 540 et 515, le nœud 540 encapsulant thématiquement le nœud 515. Par exemple, le nœud 540 correspond aux techniques de l’agriculture, et le nœud 515 à la culture de fruits. The technical classification 505 is made up of two levels of nodes, 540 and 515, with node 540 thematically encapsulating node 515. For example, node 540 corresponds to agricultural techniques, and node 515 to fruit growing.
Deux classes 520 terminales sont également représentées et rattachées au nœud 515. Ces classes correspondent aux terminaisons de l’arborescence et sont, par exemple, « techniques de culture en verger » et « techniques de culture sous serre ». On appelle, dans ce document, « classe » à la fois un nœud et une terminaison de la classification. Two 520 terminal classes are also represented and attached to node 515. These classes correspond to the endings of the tree structure and are, for example, "orchard cultivation techniques" and "greenhouse cultivation techniques". In this document, both a node and an end of the classification are called “class”.
La classification 510 de données statistiques nationales est formée de deux niveaux de nœuds, 525 et 530, le nœud 525 encapsulant thématiquement le nœud 530. Par exemple, le nœud 525 correspond aux valeurs de production agricoles des fruits et légumes, et le nœud 530 à la valeur de production agricoles des fruits. The national statistical data classification 510 is formed of two levels of nodes, 525 and 530, with node 525 thematically encapsulating node 530. For example, node 525 corresponds to the agricultural production values of fruits and vegetables, and node 530 to the agricultural production value of fruits.
Deux classes 535 terminales sont également représentées et rattachées au nœud 530. Ces classes correspondent aux terminaisons de l’arborescence et sont, par exemple, « fruits produits sous serre » et « autres productions de fruits ». On appelle, dans ce document, « donnée statistique nationale » à la fois un nœud et une terminaison d’une telle classification de données statistiques nationales. Two terminal 535 classes are also represented and attached to node 530. These classes correspond to the endings of the tree structure and are, for example, "greenhouse fruits" and "other fruit productions". In this document, "national statistical data" is referred to as both a node and an end of such a classification of national statistical data.
Lorsqu’au moins une des données parmi des classes ou des données statistiques nationales sont classifiées selon une arborescence déterminée, l’étape de comparaison 13 peut être modifiée ainsi : la similarité est mesurée entre paires de classes - données statistiques nationales est réalisée à différents niveaux d’au moins une arborescence de sorte à hiérarchiser les données statistiques nationales en fonction du niveau pour lequel l’indice de similarité est maximal. When at least one of the data among classes or national statistical data is classified according to a determined tree structure, the comparison step 13 can be modified as follows: the similarity is measured between pairs of classes - national statistical data is carried out at different levels at least one tree structure so as to rank the national statistical data according to the level for which the similarity index is maximum.
Ainsi, préférentiellement, cet indice est mesuré en partant soit du niveau le plus haut, soit le plus bas d’une classification et en allant vers l’autre extrémité. Thus, preferably, this index is measured starting either from the highest level or the lowest level of a classification and going towards the other end.
Dans l’exemple de la figure 5, par exemple, un indice de similarité est d’abord mesuré entre le nœud 540 et le nœud 525, puis entre le nœud 540 et le nœud 530, puis entre le nœud 540 et chaque donnée 535 terminale. Le même cycle recommence avec les enfants du nœud 540, et ainsi de suite, de sorte à produire une matrice d’indices de similarité. In the example of Figure 5, for example, a similarity index is first measured between node 540 and node 525, then between node 540 and node 530, then between node 540 and each terminal 535 data. . The same cycle begins again with the children of node 540, and so on, so as to produce a matrix of similarity indices.
Cette matrice permet d’identifier, pour une classe donnée, la donnée statistique nationale la plus pertinente, quel que soit le niveau dans l’arborescence de cette donnée statistique nationale. Préférentiellement, lors des calculs associés à un nœud, on inclut tout ou partie des mots-clés des enfants dudit nœud aux mots-clés du nœud. This matrix makes it possible to identify, for a given class, the most relevant national statistical data, whatever the level in the tree structure of this national statistical data. Preferably, during the calculations associated with a node, all or part of the keywords of the children of said node are included in the keywords of the node.
Dans l’exemple de la figure 5, pour la classe « techniques de culture sous serre », la donnée statistique nationale la plus similaire est « fruits produits sous serre ». Pour la classe « techniques de
culture en verger », la donnée statistique nationale la plus similaire est, dans cet exemple, « valeurs de production agricoles de fruits ». In the example of Figure 5, for the “greenhouse cultivation techniques” class, the most similar national statistical data is “greenhouse fruits”. For the class "techniques of cultivation in orchards ”, the most similar national statistical data is, in this example,“ agricultural production values of fruits ”.
Préférentiellement, plus une donnée statistique nationale associée à une classe est basse dans l’arborescence économique, plus son indice de similarité est augmenté. Preferably, the lower a national statistical data associated with a class is in the economic tree, the more its similarity index is increased.
Dans des variantes, au cours d’une étape de sélection, un utilisateur peut requérir, via une interface homme-machine, de remonter à un niveau de classification technique supérieur ou de descendre à un niveau de classification technique inférieur, dans ce cas, les données statistiques nationales sont adaptées pour correspondre au niveau de classification visé par l’utilisateur. In variants, during a selection step, a user may request, via a man-machine interface, to go up to a higher technical classification level or to go down to a lower technical classification level, in this case, National statistical data are adapted to correspond to the level of classification intended by the user.
Lorsqu’aucun indice de similarité n’a été calculé pour une paire donnée, l’indice de similarité est déterminé comme minimal, par exemple. When no similarity index has been calculated for a given pair, the similarity index is determined to be minimal, for example.
Le procédé 10 comporte une étape d’affectation d’un poids à chaque information représentative du jeu de statistiques nationales collectée en fonction du résultat de la comparaison. Le poids affecté est représentatif d’au moins un élément, ou une combinaison parmi : The method 10 includes a step of assigning a weight to each piece of information representative of the set of national statistics collected as a function of the result of the comparison. The affected weight is representative of at least one element, or a combination of:
- la mesure de similarité effectuée le cas échéant, - the similarity measurement carried out, if applicable,
- le nombre de mots-clés commun aux deux ensembles, - the number of keywords common to the two sets,
- le niveau de classification, - the classification level,
- la complétude du jeu de statistiques nationales, - the completeness of the set of national statistics,
- la provenance des données statistiques nationales, - the source of national statistical data,
- un facteur de pertinence ou de non-pertinence donné par l’utilisateur au moyen d’une interface homme machine. - a relevance or non-relevance factor given by the user by means of a man-machine interface.
Dans des modes de réalisation particuliers, tel que celui représenté en figure 1 , le procédé 10 l’étape de pondération d’un jeu de statistiques nationales est réalisée au moins partiellement en fonction d’une donnée représentative d’une nationalité d’un déposant du brevet. Cette donnée représentative peut être lue, par exemple, sur une base de données en ligne, tel un registre de brevets par exemple. In particular embodiments, such as that represented in FIG. 1, the method 10 the step of weighting a set of national statistics is carried out at least partially as a function of data representative of a nationality of an applicant. of the patent. This representative data can be read, for example, on an online database, such as a patent register for example.
Une étape de hiérarchisation 16 du jeu de statistiques nationales en fonction du poids de chaque dite information. L’étape 16 de hiérarchisation est réalisée, par exemple, par tri des statistiques nationales en relation avec une classe donnée en fonction croissante, ou décroissante du poids affecté. Ce tri est réalisé, par exemple, par un programme informatique. Cette étape 16 de hiérarchisation vise à faciliter la sélection par un utilisateur humain ou par un processus de sélection automatique réalisé, par exemple, par une intelligence artificielle. A prioritization step 16 of the set of national statistics as a function of the weight of each said item of information. Step 16 of prioritization is performed, for example, by sorting national statistics in relation to a given class as an increasing or decreasing function of the weight assigned. This sorting is carried out, for example, by a computer program. This prioritization step 16 aims to facilitate the selection by a human user or by an automatic selection process carried out, for example, by an artificial intelligence.
Dans des modes de réalisation particuliers, tel que celui représenté en figure 1 , l’étape de hiérarchisation 16 de jeux de statistiques nationales est réalisée, lorsqu’au moins deux classes sont lues, en fonction d’au moins une classe associée à au moins une donnée statistique nationale. In particular embodiments, such as that shown in FIG. 1, the step 16 of prioritizing sets of national statistics is carried out, when at least two classes are read, as a function of at least one class associated with at least national statistical data.
Dans des variantes, le serveur informatique associe à au moins une classe un indicateur représentatif d’un caractère applicatif ou technologique, la hiérarchisation 16 étant réalisée de sorte que les données statistiques nationales associées à une classe applicative soient placées plus haut hiérarchiquement. In variants, the computer server associates with at least one class an indicator representative of an application or technological character, the prioritization 16 being carried out so that the national statistical data associated with an application class are placed hierarchically higher.
Le procédé 10 comporte une étape de sélection 17 d’au moins un jeu de statistiques nationales parmi les jeux de statistiques nationales hiérarchisées. The method 10 includes a step 17 of selecting at least one set of national statistics from among the sets of hierarchical national statistics.
L’étape 17 de sélection est réalisée, par exemple, par un opérateur humain sélectionnant, via une interface homme-machine et sur un terminal informatique, au moins une donnée statistique nationale à
associer avec au moins une classe. Alternativement, cette étape 17 de sélection est réalisée de manière automatique dès qu’une paire présente un poids supérieur à une valeur limite prédéterminée ou déterminée et apprise par une intelligence artificielle. Un tel apprentissage est décrit au regard d’une étape d’apprentissage optionnelle décrite ci-dessous. The selection step 17 is carried out, for example, by a human operator selecting, via a man-machine interface and on a computer terminal, at least one national statistical data item. associate with at least one class. Alternatively, this selection step 17 is carried out automatically as soon as a pair has a weight greater than a predetermined or determined limit value and learned by an artificial intelligence. Such learning is described with regard to an optional learning step described below.
Dans des modes de réalisation, le procédé 10 comporte une étape d’enregistrement, mise en oeuvre, par exemple, par un serveur informatique connecté au terminal utilisé par l’opérateur humain pour enregistrer chaque sélection faite par l’opérateur de sorte à constituer graduellement une base de données de liens entre classes et données statistiques nationales. Cet enregistrement vise à faciliter la sélection réalisée au cours d’une deuxième étape de sélection. In some embodiments, the method 10 comprises a recording step, implemented, for example, by a computer server connected to the terminal used by the human operator to record each selection made by the operator so as to gradually constitute a database of links between classes and national statistical data. This registration is intended to facilitate the selection made during a second selection stage.
Dans des modes de réalisation, une étape de connexion est réalisée, par exemple, par la mise en oeuvre d’un réseau de données, tel Internet ou un réseau cellulaire par exemple, entre le deuxième terminal informatique et le serveur informatique enregistrant les associations entre classes et données statistiques nationales. In some embodiments, a connection step is performed, for example, by implementing a data network, such as the Internet or a cellular network for example, between the second computer terminal and the computer server recording the associations between national statistical classes and data.
La deuxième étape de sélection est réalisée, par exemple, par un opérateur humain sélectionnant, via une interface homme-machine et sur un terminal informatique, au moins une association parmi les associations enregistrées. Alternativement, cette étape de sélection est réalisée de manière automatique en fonction d’un comportement de l’utilisateur appris par une intelligence artificielle. Un tel apprentissage est décrit au regard d’une étape d’apprentissage optionnelle décrite ci- dessous. The second selection step is performed, for example, by a human operator selecting, via a man-machine interface and on a computer terminal, at least one association among the registered associations. Alternatively, this selection step is performed automatically based on user behavior learned by artificial intelligence. Such learning is described with regard to an optional learning step described below.
À l’issue de ce procédé 10, un brevet a été associé une jeu de statistiques nationales, une telle association étant fournie, par exemple, affichée ou utilisée dans un processus ultérieur. As a result of this process 10, a patent has been associated with a set of national statistics, such association being provided, for example, displayed or used in a subsequent process.
Dans des modes de réalisation particuliers, le procédé 10 comporte une étape d’inscription d’au moins une association sélectionnée au cours de la deuxième étape de sélection sur un serveur informatique. In particular embodiments, the method 10 comprises a step of registering at least one association selected during the second selection step on a computer server.
Cette étape d’inscription est réalisée, par exemple, de manière similaire à l’étape d’enregistrement, via la connexion du serveur informatique au deuxième terminal. Préférentiellement, cette association est inscrite dans un profil d’utilisateur de l’utilisateur ayant réalisé la deuxième étape de sélection. This registration step is performed, for example, in a similar manner to the registration step, via the connection of the computer server to the second terminal. Preferably, this association is entered in a user profile of the user who performed the second selection step.
Dans ces variantes, l'étape d’affectation d’un poids peut être adaptée en fonction d’un contexte de l’utilisateur, ou d’un indicateur de pertinence ou non, et de réduire le champ des associations applicables à l’utilisateur. Ainsi, les associations enregistrées au cours de l’étape d’affectation d’un poids 17 peuvent être contextuellement neutres tandis que les associations inscrites au cours de l’étape d’inscription tiennent comptent du contexte propre à l’utilisateur. In these variants, the step of assigning a weight can be adapted as a function of a user's context, or of an indicator of relevance or not, and of reducing the field of associations applicable to the user. . Thus, the associations recorded during the weight assignment step 17 can be contextually neutral while the associations recorded during the enrollment step take into account the user's own context.
Par exemple, une donnée statistique nationale peut associer une classe technique de « moyens de commandes électroniques » à la fois à une donnée statistique nationale de « commandes automatiques de portes » et de « commandes automatiques de vannes de gaz ». Ces deux associations peuvent avoir été sélectionnées au cours de la première étape 17 de sélection car visant bien des moyens de commandes électriques. Au cours de la deuxième étape de sélection, l’utilisateur, gestionnaire d’un portefeuille de brevets dans le domaine du gaz, sélectionne uniquement les commandes automatiques de vannes de gaz de sorte à visualiser des données statistiques nationales pour son utilisation des brevets, modifiant ainsi le poids affecté aux jeux de statistiques nationales.
Dans des modes de réalisation, au moins une étape de sélection 17 est réalisée par un algorithme d’apprentissage automatique. For example, a national statistical datum can associate a technical class of “electronic control means” with both a national statistical datum of “automatic door controls” and “automatic gas valve controls”. These two associations may have been selected during the first selection step 17 because they target many electrical control means. During the second selection step, the user, manager of a patent portfolio in the gas field, selects only the automatic controls of gas valves so as to visualize national statistical data for his use of patents, modifying thus the weight assigned to the sets of national statistics. In embodiments, at least one selection step 17 is performed by an automatic learning algorithm.
Dans des modes de réalisation particuliers, tel que celui représenté en figure 1 , le procédé 10 comporte en aval de l’étape d’inscription, une étape 150 d’apprentissage d’un comportement de sélection au cours de la deuxième étape de sélection, l’algorithme d’apprentissage automatique sélectionnant une association en fonction d’au moins un comportement appris. In particular embodiments, such as that shown in FIG. 1, the method 10 comprises downstream from the registration step, a step 150 of learning a selection behavior during the second selection step, the machine learning algorithm selecting an association based on at least one learned behavior.
L’étape 150 d’apprentissage est réalisée, par exemple, de manière probabiliste par lecture successive des sélections réalisées par un utilisateur pour déterminer un comportement de l’utilisateur en regard des premiers et deuxièmes ensembles de mots-clés. La description qui suit considère qu’un premier ensemble est défini par l’intitulé d’une classe et qu’un deuxième ensemble est défini par l’intitulé d’un jeu de statistiques nationales. Lorsqu’une fréquence d’association classe - jeu de statistique nationale est inférieure à une fréquence limite déterminée, l’association classe - jeu de statistiques nationales est soit retirée pour cet utilisateur, soit prédésélectionnée. Lorsqu’une fréquence d’association est basse pour un nombre déterminé d’utilisateurs distincts, le poids affecté entre la classe et le jeu de statistiques nationales peut être réduit de sorte qu’au cours de l’étape de sélection, cette association soit hiérarchisée à un niveau plus bas ou que, si la sélection est automatisée, cette association soit effacée. The learning step 150 is performed, for example, in a probabilistic manner by successively reading the selections made by a user to determine user behavior with respect to the first and second sets of keywords. The following description assumes that a first set is defined by the title of a class and that a second set is defined by the title of a set of national statistics. When a class - national statistics set association frequency is less than a determined cutoff frequency, the class - national statistics set association is either withdrawn for that user or pre-selected. When an association frequency is low for a determined number of distinct users, the weight assigned between the class and the set of national statistics can be reduced so that during the selection step, this association is prioritized at a lower level or that, if the selection is automated, this association is deleted.
Dans des modèles d’apprentissage plus approfondis, l’algorithme d’apprentissage automatique est conçu pour détecter, dans un ensemble de mots-clés non sélectionnés par un utilisateur en regard d’un jeu de statistiques nationales, la composition de cet ensemble de sorte à établir une règle en fonction des comportements successifs de l’utilisateur. In deeper learning models, the machine learning algorithm is designed to detect, in a set of keywords not selected by a user against a set of national statistics, the composition of that set so to establish a rule according to the successive behaviors of the user.
L’étape 18 de fourniture est réalisée, par exemple, par la mise en oeuvre d’un affichage sur un écran du deuxième terminal. The supply step 18 is carried out, for example, by the implementation of a display on a screen of the second terminal.
On décrit, ci-après des étapes particulières et des modes de réalisation particuliers de l’étape de construction de la deuxième base de données. Particular steps and particular embodiments of the step of building the second database are described below.
Dans des modes de réalisation, le procédé objet de la présente invention comporte, en aval de l’étape de collecte 32, une étape de normalisation d’au moins une partie des données collectées. In some embodiments, the method that is the subject of the present invention comprises, downstream of the collection step 32, a step of normalizing at least part of the data collected.
Le problème à résoudre est le suivant : un ensemble de données collecté peut comporter des données classées selon plusieurs approches systématiques distinctes (de type taxonomie par exemple), rendant les données incohérentes. Dans un tel ensemble, chaque donnée comporte à la fois une valeur et un indicateur de système de classification utilisé. Toutefois, il résulte de la pluralité d’approches systématiques utilisées une incohérence entre les données représentatives, pourtant, d’un même objet ou concept. The problem to be solved is the following: a collected data set can include data classified according to several distinct systematic approaches (of taxonomy type for example), making the data inconsistent. In such a set, each data item includes both a value and an indicator of the classification system used. However, the result of the plurality of systematic approaches used is an inconsistency between representative data, however, of the same object or concept.
Une illustration de cet exemple est, par exemple, la classification d’une valeur monétaire de production de chaussures évoluant d’une année à l’autre. Dans cette illustration, cette valeur monétaire peut être positionnée dans une classe nommée « A » d’un premier système pour une année déterminée et dans une classe nommée « B » d’un deuxième système pour une autre année. Or, pour la première année déterminée, la classe « B » correspond dans le premier système utilisé à la valeur monétaire de production de savon, résultant en une incohérence des données collectées. An illustration of this example is, for example, the classification of a monetary value of footwear production changing from year to year. In this illustration, this monetary value can be positioned in a class named "A" of a first system for a given year and in a class named "B" of a second system for another year. However, for the first year determined, class “B” corresponds in the first system used to the monetary value of soap production, resulting in an inconsistency in the data collected.
Cette illustration peut être schématisée ainsi, pour une donnée représentative d’un objet et/ou concept unique :
[Table 1 ] This illustration can be schematized as follows, for data representative of a single object and / or concept: [Table 1]
Ainsi, au cours de l’étape de normalisation, un ensemble de données collectées est traduit selon une approche systématique unifiée. Cette étape de normalisation est réalisée, par exemple, par un dispositif électronique de calcul configuré pour attribuer une valeur à chaque entrée d’une base de données comportant l’ensemble de données, ladite valeur étant associée à un indicateur de système de classification utilisé unique. Thus, during the normalization stage, a set of collected data is translated according to a unified systematic approach. This normalization step is performed, for example, by an electronic computing device configured to assign a value to each entry of a database comprising the set of data, said value being associated with a single classification system indicator used. .
Le système de classification utilisé peut être déterminé par un utilisateur, via une interface homme-machine. L’utilisateur choisit, par exemple, un système de classification parmi une liste de tous les systèmes de classification dont un indicateur est détecté parmi les données de l’ensemble de données. The classification system used can be determined by a user, via a man-machine interface. For example, the user chooses a classification system from a list of all classification systems for which an indicator is detected among the data in the dataset.
Le système de classification utilisé peut être déterminé automatiquement, par exemple, par le dispositif électronique de calcul configuré pour déterminer de manière statistique un nombre de données associées à chaque système de classification et pour sélectionner le système de classification dont le nombre d’occurrences est le plus élevé. Alternativement, cette approche statistique peut être réalisée sur un échantillon de données correspondant à des états de l’objet et/ou concept compris entre deux dates déterminées, par exemple deux ans en amont de la date d’exécution de l’étape d’harmonisation. The classification system used can be determined automatically, for example, by the electronic computing device configured to statistically determine a number of data associated with each classification system and to select the classification system whose number of occurrences is the highest. higher. Alternatively, this statistical approach can be carried out on a sample of data corresponding to states of the object and / or concept between two determined dates, for example two years before the date of execution of the harmonization step. .
Alternativement, le dispositif électronique de calcul est configuré pour déterminer de manière statistique un nombre de données associées à chaque système de classification pour des données correspondent au dernier état de l’objet et/ou concept que ces données représentent et pour sélectionner le système de classification dont le nombre d’occurrences est le plus élevé. Alternatively, the electronic computing device is configured to statistically determine a number of data associated with each classification system for data corresponding to the last state of the object and / or concept that these data represent and to select the classification system with the highest number of occurrences.
Une fois le système de classification utilisé déterminé, l’étape de normalisation met en œuvre, préférentiellement, une table de correspondance entre systèmes de classification pour remplacer les indicateurs de système de classification non utilisés par les indicateurs du système de classification. Par exemple, dans le tableau ci-dessous, les entrées correspondant aux lignes « classe 2010 - A » et « système de classification 2010 - 1 » sont remplacées ou complétées par des lignes « classe 2010 - B » et « système de classification 2010 - 2 ». Once the classification system used has been determined, the normalization step preferably implements a correspondence table between classification systems to replace the classification system indicators not used by the indicators of the classification system. For example, in the table below, the entries corresponding to the lines "class 2010 - A" and "classification system 2010 - 1" are replaced or completed by lines "class 2010 - B" and "classification system 2010 - 2 ”.
La table de correspondance peut être prédéterminée, collectée ou dynamique et obtenue par l’utilisation d’un algorithme d’apprentissage automatique configuré pour déterminer une proximité sémantique entre objets d’au moins deux systèmes de classification différents et, en fonction d’une valeur de cette proximité sémantique, déterminer une correspondance entre les classes correspondantes auxdits objets dans les systèmes de classification. The correspondence table can be predetermined, collected or dynamic and obtained by the use of a machine learning algorithm configured to determine a semantic proximity between objects of at least two different classification systems and, according to a value from this semantic proximity, determining a correspondence between the classes corresponding to said objects in the classification systems.
Par exemple, dans le tableau ci-dessus, les valeurs de 2010 et 201 1 sont toutes deux représentatives, quel que soit le système de classification, de la valeur de production de chaussures. La proximité entre ces deux labels est totale puisque ces labels sont identiques : une correspondance
peut ainsi être automatiquement générée entre les classes A, du système de classification 2010 et B du système de classification 201 1 . For example, in the table above, the values of 2010 and 201 1 are both representative, regardless of the classification system, of the production value of footwear. The proximity between these two labels is total since these labels are identical: a correspondence can thus be automatically generated between classes A, of the 2010 classification system and B of the 201 1 classification system.
Dans des variantes, lorsque cette table de correspondance associe plusieurs classes dans un système non-utilisé à une classe dans le système utilisé, les valeurs associées à ces classes sont additionnées pour produire une valeur composite. Par exemple, si une valeur en 2010 pour la classe « A » est de 10 et la valeur en 2010 pour une classe « B » est de 20 et que la table de correspondance fait correspondre « A » à la classe « C » et « B » à la classe « C », la valeur en classe « C » pour 2010 et dans le système de classification de « C » est de 30. In variations, when this correspondence table associates several classes in an unused system with a class in the used system, the values associated with these classes are added together to produce a composite value. For example, if a value in 2010 for class "A" is 10 and the value in 2010 for a class "B" is 20 and the correspondence table matches "A" to class "C" and " B ”to class“ C ”, the value in class“ C ”for 2010 and in the classification system of“ C ”is 30.
Parfois, une telle approche est impossible, notamment lorsqu’une classe d’un système de classification antérieur au système de classification utilisé est scindée en deux. Il est, dans ces cas-là, impossible de savoir quelle part d’une valeur associée à une classe du système de classification antérieure est à affecter à chacune des deux nouvelles classes dans le système de classification utilisé. Dans de tels cas, le dispositif électronique de calcul attribue soit une valeur de 0 dans le système de classification utilisé, soit une valeur déterminée en fonction d’une proportion déterminée entre les deux classes du système de classification utilisé. Sometimes such an approach is not possible, especially when a class from a classification system that predates the classification system used is split in two. In these cases, it is impossible to know how much of a value associated with a class in the previous classification system is to be assigned to each of the two new classes in the classification system used. In such cases, the electronic calculation device assigns either a value of 0 in the classification system used, or a value determined according to a determined proportion between the two classes of the classification system used.
Dans ces variantes, le procédé objet de la présente invention comporte une étape d’extrapolation 34 d’une statistique nationale d’un jeu de statistiques nationales présentant une statistique nationale manquante, chaque valeur obtenue par extrapolation étant associée au deuxième ensemble de mots- clés de l’information représentative du jeu de statistiques nationales de la valeur extrapolée. Cette étape 34 d’extrapolation est réalisée, par exemple, par le dispositif électronique de calcul calculant une moyenne de la proportion relative de valeurs connues pour des classes du système de classification utilisé formant, de manière combinée, une classe du système de classification antérieur pour un autre jeu de données connu. Par exemple, voici un tableau de données : In these variants, the method that is the subject of the present invention comprises a step of extrapolation 34 of a national statistic from a set of national statistics exhibiting a missing national statistic, each value obtained by extrapolation being associated with the second set of keywords. information representative of the national statistics set of the extrapolated value. This extrapolation step 34 is performed, for example, by the electronic computing device calculating an average of the relative proportion of known values for classes of the classification system used forming, in a combined manner, a class of the previous classification system for another known dataset. For example, here is a data table:
[Table 2] [Table 2]
Dans cet exemple, la valeur associée à la classe « A » dans le système de classification 2010 correspond en partie à la valeur associée à la classe « B » et en partie à la valeur associée à la classe « C » du système de classification 201 1 . La valeur associée aux classes « B » et « C » dans le système de classification 201 1 représentent respectivement 75% et 25% du total de ces deux valeurs. In this example, the value associated with class "A" in the 2010 classification system corresponds in part to the value associated with class "B" and in part to the value associated with class "C" in classification system 201 1. The value associated with the classes “B” and “C” in the classification system 201 1 represent respectively 75% and 25% of the total of these two values.
Ainsi, la valeur associée à la classe « A » dans le système de classification 2010 peut recevoir en valeur correspondante dans les classes « B » et « C » du système de classification 201 1 respectivement les valeurs « 1500 » et « 500 ».
Dans des modes de réalisation, le procédé objet de la présente invention comporte une étape de calcul d’une valeur agrégée en fonction de valeurs collectées au cours de l’étape 32 de collecte, harmonisées au cours de l’étape d’harmonisation et/ou extrapolées au cours de l’étape 34 d’extrapolation. Une telle valeur agrégée correspond, par exemple, à une valeur d’un indicateur économique pour un office de brevet, cette valeur d’indicateur économique étant obtenue par addition des valeurs de l’indicateur économique pour les pays membres de cet office de brevets. Thus, the value associated with the class “A” in the classification system 2010 can receive as a corresponding value in the classes “B” and “C” of the classification system 201 1 respectively the values “1500” and “500”. In some embodiments, the method that is the subject of the present invention comprises a step of calculating an aggregated value as a function of values collected during the collection step 32, harmonized during the harmonization step and / or extrapolated during step 34 of extrapolation. Such an aggregated value corresponds, for example, to a value of an economic indicator for a patent office, this economic indicator value being obtained by adding the values of the economic indicator for the member countries of this patent office.
Dans des modes de réalisation, l’étape 34 d’extrapolation consiste à combler, dans une suite de données, des valeurs manquantes. In some embodiments, the extrapolation step 34 consists of filling in missing values in a series of data.
Par exemple, si le jeu de données comporte seulement des valeurs pour les années 2010, 201 1 , 2013 et 2014, quelle valeur considérer pour l’année 2012 ? Cette continuité de la donnée est essentielle pour détecter une tendance dans de nombreux usages. For example, if the dataset has only values for the years 2010, 201 1, 2013 and 2014, what value should be considered for the year 2012? This continuity of data is essential to detect a trend in many uses.
Plusieurs méthodes d’extrapolation peuvent être employées ici. Dans une première variante, une interpolation linéaire est employée pour déterminer une fonction mathématique qui comporte deux points entourant une donnée manquante et en calculant, à partir de cette fonction, la valeur pour le point manquant. Par exemple, si la valeur associée à 201 1 est « 10 » et la valeur associée à 2013 est « 30 », la valeur 2012 peut être estimée à « 20 », soit la moyenne de « 10 » et de « 30 ». Several extrapolation methods can be used here. In a first variant, a linear interpolation is used to determine a mathematical function which comprises two points surrounding a missing piece of data and by calculating, from this function, the value for the missing point. For example, if the value associated with 201 1 is "10" and the value associated with 2013 is "30", the value 2012 can be estimated as "20", which is the average of "10" and "30".
Une telle méthode, toutefois est limitée aux cas où une valeur postérieure à la valeur recherchée est connue et, de plus, perd grandement en précision lorsqu’il manque plusieurs valeurs successives. Enfin, une telle méthode empêche la valeur ainsi calculée de sortir de l’intervalle compris entre la valeur minimale et la valeur maximale des valeurs entourant la valeur à estimer. Such a method, however, is limited to cases where a value later than the sought value is known and, moreover, greatly loses precision when several successive values are missing. Finally, such a method prevents the value thus calculated from falling outside the interval between the minimum value and the maximum value of the values surrounding the value to be estimated.
Pour pallier ces inconvénients, une méthode alternative d’extrapolation employée peut consister en une extrapolation de tendance. To overcome these drawbacks, an alternative extrapolation method used can consist of a trend extrapolation.
Dans des modes de réalisation, les jeux de statistiques nationales sont organisés dans au moins une arborescence comportant au moins deux niveaux, un niveau dit « supérieur » auquel est rattaché un niveau dit « inférieur » comportant plusieurs jeux de statistiques nationales, le jeu de statistique nationale du niveau supérieur étant égal à la somme des jeux de valeurs du niveau inférieur. Dans ces modes de réalisation, une fonction d’ajustement de courbe peut être employée sur un ensemble de valeurs antérieures à une valeur à combler. Une fois cette courbe obtenue, le calcul de la valeur manquante peut être réalisé en fonction d’une des coordonnées de cette valeur, comme une année par exemple. In some embodiments, the sets of national statistics are organized in at least one tree structure comprising at least two levels, a so-called “higher” level to which is attached a so-called “lower” level comprising several sets of national statistics, the set of statistics national level of the higher level being equal to the sum of the sets of values of the lower level. In these embodiments, a curve fitting function can be employed on a set of values prior to a value to be filled. Once this curve is obtained, the calculation of the missing value can be performed according to one of the coordinates of this value, such as a year for example.
Toutefois, une telle méthode peut engendrer des courbes présentant localement des taux de croissance trop importants pour être cohérents avec des valeurs réelles mesurées a posteriori. However, such a method can generate curves locally exhibiting growth rates that are too high to be consistent with real values measured a posteriori.
Pour éviter un tel inconvénient, une valeur à combler peut-être déterminée par pondération des résultats de différentes méthodes d’extrapolation, telles par exemple les méthodes d’interpolation linéaire et d’ajustement de courbe. To avoid such a drawback, a value to be filled can be determined by weighting the results of different extrapolation methods, such as, for example, linear interpolation and curve fitting methods.
Dans des modes de réalisation, dans lequel les jeux de statistiques nationales sont organisés dans au moins une arborescence comportant au moins deux niveaux, un niveau dit « supérieur » auquel est rattaché un niveau dit « inférieur » comportant plusieurs jeux de statistiques nationales, le jeu de statistique nationale du niveau supérieur étant égal à la somme des jeux de valeurs du niveau inférieur. In embodiments, in which the sets of national statistics are organized in at least one tree structure comprising at least two levels, a so-called “higher” level to which is attached a so-called “lower” level comprising several sets of national statistics, the set of national statistics of the higher level being equal to the sum of the sets of values of the lower level.
Dans des modes de réalisation, les jeux de statistiques nationales sont organisés selon deux arborescences distinctes, une statistique nationale d’une arborescence étant extrapolée en fonction
d’un jeu de statistiques nationales d’une autre arborescence. Dans ces modes de réalisation, des méthodes d’extrapolation consistent en l’application d’une tendance issue d’un autre jeu de valeurs au jeu de valeurs pour lequel une valeur doit être comblée, lors d’une étape de comparaison d’arborescences. Cet autre jeu de valeurs peut être issu d’une étape 32 de collecte d’un jeu de statistiques nationales distinctes. In some embodiments, the sets of national statistics are organized in two distinct trees, with a national statistic in a tree being extrapolated based on from a set of national statistics from another tree. In these embodiments, extrapolation methods consist in applying a trend from another set of values to the set of values for which a value must be filled, during a tree comparison step. . This other set of values can result from a step 32 of collecting a set of distinct national statistics.
Ces méthodes consistent à déterminer un taux de variation d’une valeur à partir d’un taux de variation mesurée pour d’autres valeurs connues d’un autre jeu de valeurs. These methods consist in determining a rate of change of a value from a rate of change measured for other known values of another set of values.
Par exemple de manière très simplifiée, si entre les années 2010 et 201 1 , le taux de croissance du Produit Intérieur Brut est de 5%, une valeur de production de chaussures en 201 1 , à combler, peut être calculée par l’utilisation de la formule « valeur de production de chaussures en 2010 x 105% ». For example in a very simplified way, if between the years 2010 and 201 1, the growth rate of the Gross Domestic Product is 5%, a production value of shoes in 201 1, to be filled, can be calculated by the use of the formula "production value of shoes in 2010 x 105%".
Le jeu de valeurs utilisé pour déterminer cette variation peut être prédéterminé ou, préférentiellement, déterminé automatiquement. The set of values used to determine this variation can be predetermined or, preferably, determined automatically.
Dans des variantes où le jeu de valeurs sélectionné est déterminé automatiquement, une étape de détermination est réalisée au cours du procédé objet de la présente invention. Cette étape de détermination est réalisée, par exemple, par un dispositif électronique de calcul. In variants where the selected set of values is determined automatically, a determination step is carried out during the method which is the subject of the present invention. This determination step is carried out, for example, by an electronic calculation device.
Au cours de cette étape de détermination, au moins un jeu de valeurs est sélectionné parmi un ensemble de jeux de valeurs disponibles. Pour chaque tel jeu de valeurs sélectionné, une évaluation de la pertinence du jeu de valeurs est réalisée. Cette évaluation est réalisée, par exemple, par la comparaison entre une variation dans le temps du jeu de valeurs et une variation dans le temps du jeu de valeurs dont une valeur est à combler. Si les signatures des variations correspondent, c’est-à-dire présentent un indice de corrélation supérieur à une valeur déterminée, le jeu de valeurs évalué est validé. During this determination step, at least one set of values is selected from a set of sets of available values. For each such selected set of values, an evaluation of the relevance of the set of values is performed. This evaluation is carried out, for example, by the comparison between a variation over time of the set of values and a variation over time of the set of values with a value to be filled. If the signatures of the variations match, that is to say have a correlation index greater than a determined value, the set of values evaluated is validated.
Le taux de variation correspondant à une valeur connue dans le jeu de valeurs connu correspondant à une valeur inconnue du jeu de valeurs à combler est ensuite appliqué au jeu de valeurs à combler pour déterminer la valeur inconnue. The rate of change corresponding to a known value in the known set of values corresponding to an unknown value of the set of values to be filled is then applied to the set of values to be filled to determine the unknown value.
Dans des variantes, des valeurs connues du jeu de valeurs à combler sont virtuellement considérées comme inconnues, de sorte que la fiabilité de prédiction peut être évaluée au cours de l’étape d’évaluation à partir de valeurs réelles. In variations, known values of the set of values to be filled are considered virtually unknown, so that the reliability of the prediction can be assessed during the evaluation step from actual values.
Dans des variantes, que l’extrapolation soit réalisée pour combler une valeur manquante dans une suite de valeurs ou pour calculer une valeur en bout de jeu de valeurs, le procédé objet de la présente invention met en oeuvre un algorithme d’apprentissage automatique configuré pour à partir d’un ensemble de valeurs connues et d’un nombre déterminé de paramètres associés à ces valeurs, déterminer une pondération entre des valeurs associées à paramètres d’autres jeux de valeurs. In variants, whether the extrapolation is carried out to fill a missing value in a series of values or to calculate a value at the end of the set of values, the method that is the subject of the present invention uses an automatic learning algorithm configured to from a set of known values and from a determined number of parameters associated with these values, determining a weighting between values associated with parameters of other sets of values.
Ci-après, un exemple d’étape d’extrapolation est fourni. Below, an example of an extrapolation step is provided.
Dans cet exemple, on considère que les valeurs collectées sont issues de sources distinctes et que ces valeurs sont représentatives de différentes manières de caractériser un pays. À titre d’exemple : In this example, we consider that the values collected come from different sources and that these values are representative of different ways of characterizing a country. For exemple :
- une première source de données fournit un jeu de valeurs représentatives d’un nombre de naissances, du PIB et d’une production énergétique issues de sources renouvelables pour la France, le Royaume-Uni et l’Allemagne,
- une deuxième source de données fournit un jeu de valeurs représentatives d’une valeur monétaire représentative des imports et exports de couches infantiles recyclables pour la France et le Royaume-Uni et - a first data source provides a set of values representative of a number of births, GDP and energy production from renewable sources for France, the United Kingdom and Germany, - a second data source provides a set of values representative of a monetary value representative of imports and exports of recyclable infant diapers for France and the United Kingdom and
- une troisième source de données fournit un jeu de valeurs représentatives d’une valeur monétaire représentative de la production de couches infantiles pour la France et l’Allemagne. - a third data source provides a set of values representative of a monetary value representative of the production of infant layers for France and Germany.
Chaque jeu de valeurs comporte une valeur pour chacune des années 2010, 201 1 et 2012, par exemple. Dans cet exemple, la valeur de production de couches infantiles est inconnue pour le Royaume-Uni, quelle que soit l’année. Each value set has a value for each of the years 2010, 201 1, and 2012, for example. In this example, the production value of infant diapers is unknown for the United Kingdom, regardless of the year.
Pour déterminer les valeurs de production de couches infantiles du Royaume-Uni de 2010, 201 1 et 2012, le dispositif électronique calcul évalue l’évolution du PIB de France entre 2010 et 201 1 et entre 201 1 et 2012 et compare cette évolution avec, respectivement, l’évolution de la valeur monétaire représentative de la production de couches infantiles pour la France entre 2010 et 201 1 et entre 201 1 et 2012. Si ces évolutions présentent un coefficient de corrélation plus élevé que, par exemple, révolution de la production énergétique issue de sources renouvelables de France entre 2010 et 201 1 et entre 201 1 et 2012 comparée avec, respectivement, l’évolution de la valeur monétaire représentative de la production de couches infantiles pour la France entre 2010 et 201 1 et entre 201 1 et 2012, alors le dispositif de calcul détermine que l’évolution du PIB est plus représentative que l’évolution de la production énergétique issue de sources renouvelables pour estimer la valeur la valeur de production de couches infantiles. Connaissant le PIB du Royaume-Uni et son évolution dans le temps, le dispositif électronique de calcul détermine une règle de trois applicable en France et en Allemagne entre le PIB et la production de couches infantiles et applique cette règle de trois à la valeur du PIB du Royaume- Uni pour chaque année pour déterminer la valeur de production infantile des années 2010, 201 1 et 2012. To determine the production values of infant diapers in the United Kingdom for 2010, 201 1 and 2012, the electronic calculation device evaluates the evolution of the GDP of France between 2010 and 201 1 and between 201 1 and 2012 and compares this evolution with, respectively, the change in the monetary value representative of the production of infant diapers for France between 2010 and 201 1 and between 201 1 and 2012. If these changes have a higher correlation coefficient than, for example, the production revolution energy from renewable sources in France between 2010 and 201 1 and between 201 1 and 2012 compared with, respectively, the change in the monetary value representative of the production of infant diapers for France between 2010 and 201 1 and between 201 1 and 2012, then the calculation device determines that the change in GDP is more representative than the change in energy production from renewable sources to estimate the value production of infant diapers. Knowing the GDP of the United Kingdom and its evolution over time, the electronic calculator determines a rule of three applicable in France and Germany between the GDP and the production of infant layers and applies this rule of three to the value of the GDP of the United Kingdom for each year to determine the value of infant production for the years 2010, 201 1 and 2012.
Dans une variante plus perfectionnée, basée sur une technologie d’apprentissage automatique, le dispositif électronique de calcul attribue des facteurs de pondération à chacun des types de données et à des paramètres enregistrés propres à chaque pays à partir de données passées connues de valeurs de production de couches pour le Royaume-Uni. In a more sophisticated variant, based on machine learning technology, the electronic computing device assigns weighting factors to each of the data types and to recorded parameters specific to each country from known past data of production values. diapers for the UK.
On observe, en figure 4, un deuxième mode de réalisation 40 du procédé objet de la présente invention. Le mode réalisation représenté en figure 4 est compatible avec tous les modes réalisation décrits ci-dessus. Les étapes 1 1 à 18 sont identiques aux modes de réalisations décrits ci-dessus. FIG. 4 shows a second embodiment 40 of the method that is the subject of the present invention. The embodiment shown in FIG. 4 is compatible with all of the embodiments described above. Steps 1 1 to 18 are identical to the embodiments described above.
Le procédé 40 comporte additionnellement les étapes 41 à 46. The method 40 additionally comprises steps 41 to 46.
Pour l’implémentation du procédé 40, la première base de données comporte pour chaque brevet, une identification d’au moins un titulaire et un code représentatif de la portée géographique. For the implementation of method 40, the first database includes for each patent, an identification of at least one holder and a code representative of the geographical scope.
Le procédé 40 comporte : The method 40 comprises:
- une étape d’association 41 d’au moins un autre brevet de la première base de données correspondant au premier ensemble de mots-clés de l’identifiant saisi et/ou au titulaire du titre, - a step of associating 41 at least one other patent from the first database corresponding to the first set of keywords of the identifier entered and / or to the holder of the title,
- une étape de décompte 42 du nombre d’occurrences de chaque code représentatif de la portée géographique en fonction de chaque autre brevet associé brevet dont l’identifiant est saisi ; - a counting step 42 of the number of occurrences of each code representative of the geographical scope as a function of each other associated patent patent whose identifier is entered;
- une étape de pondération 43 de chaque statistique nationale du jeu de statistiques nationales sélectionné en fonction du nombre d’occurrences,
- lors de l’étape de fourniture 18, le jeu de statistiques nationales est classé par pondération décroissante. - a weighting step 43 of each national statistic of the set of national statistics selected according to the number of occurrences, - during the supply step 18, the set of national statistics is classified by decreasing weighting.
Dans des modes de réalisation, l’étape d’association 41 associe au moins un autre brevet de la première base de données correspondant au premier ensemble de mots-clés de l’identifiant saisi. L’étape d’association 41 est réalisée, par exemple, par la mise en oeuvre informatique d’un algorithme de mesure de proximité lexicale entre deux ensembles de mots-clés. Un tel algorithme est, par exemple, un algorithme de mesure d’une distance : In embodiments, the association step 41 associates at least one other patent of the first database corresponding to the first set of keywords of the entered identifier. The association step 41 is performed, for example, by the computer implementation of an algorithm for measuring lexical proximity between two sets of keywords. Such an algorithm is, for example, an algorithm for measuring a distance:
- de Hamming, - from Hamming,
- de Levenshtein ? - from Levenshtein?
- de Damerau-Levenshtein, la distance d'édition et la distance d'édition avec transposition et/ou - from Damerau-Levenshtein, the edit distance and the edit distance with transposition and / or
- distance de Jaro-Winkler. - Jaro-Winkler distance.
Ces exemples de distances sont bien connus de l’art antérieur et du domaine de la fouille de texte, visent à évaluer la distance qui sépare deux chaînes de texte, tels les mots-clés de classe ou de données statistiques nationales par exemple. These examples of distances are well known in the prior art and in the field of text mining, aim to assess the distance between two text strings, such as class keywords or national statistical data for example.
Cette mesure de distance, ou d’indice de similarité à l’inverse, a lieu pour au moins une paire formée d’un ensemble, ou sous-ensemble, de mots-clés d’une classe et d’un ensemble, ou sous- ensemble, de mots-clés d’une donnée statistique nationale. This measurement of distance, or of similarity index on the contrary, takes place for at least one pair formed of a set, or subset, of keywords of a class and of a set, or sub - set of keywords of a national statistical data.
Dans des modes de réalisation, au moins un intitulé d’une classe technique est associé à un ensemble de mots-clés. Par exemple, des mots-clés peuvent être extraits dudit intitulé. In embodiments, at least one title of a technical class is associated with a set of keywords. For example, keywords can be extracted from said title.
Préférentiellement, ces modes de réalisation comportent une étape d’évaluation d’une classe technique prédominante associée à l’identifiant saisi en fonction de chaque classe technique associée à l’identifiant saisi. Chaque classe technique associée à l’identifiant saisi donne une information concernant un domaine technique auquel s’applique le titre de propriété industrielle. L’étape d’évaluation permet de déduire le domaine technique prédominant. Preferably, these embodiments include a step of evaluating a predominant technical class associated with the identifier entered as a function of each technical class associated with the identifier entered. Each technical class associated with the identifier entered provides information concerning a technical field to which the industrial property title applies. The evaluation step allows the predominant technical area to be deduced.
Préférentiellement, l’étape d’évaluation comporte : Preferably, the evaluation step comprises:
- une étape de troncature de chaque classe technique pour obtenir une classe tronquée, - a truncation step of each technical class to obtain a truncated class,
- une étape de décompte du nombre d’occurrences de classes de même troncature, le domaine technique évalué correspondant à la classe tronquée de nombre d’occurrences majoritaire. - a step of counting the number of occurrences of classes of the same truncation, the technical field evaluated corresponding to the truncated class of the majority number of occurrences.
Lors de l’étape de troncature, chaque classe est tronquée telle que la sous-classe est le dernier élément pris en compte. Par exemple, la classe « A21 C1/06 » est écourtée à « A21 C ». L’étape de troncature est effectuée informatiquement, par exemple au moyen d’un serveur applicatif interrogeant la première base de données pour récupérer chaque classe. Dans des modes de réalisation, la classe peut être écourtée aux chiffres représentatifs de la classe. Par exemple, la classe « A21 C1/06 » est écourtée à « A21 ». En d’autres termes, lorsque la classification technique des brevets, par exemple la CPC ou la CIB, est vue comme une arborescence, la troncature revient à remonter à un nœud supérieur de l’arborescence. During the truncation step, each class is truncated such that the subclass is the last element taken into account. For example, the class “A21 C1 / 06” is shortened to “A21 C”. The truncation step is performed by computer, for example by means of an application server querying the first database to retrieve each class. In embodiments, the class may be shortened to digits representative of the class. For example, the class “A21 C1 / 06” is shortened to “A21”. In other words, when the technical classification of patents, for example the CPC or the IPC, is seen as a tree structure, the truncation amounts to going up to a higher node in the tree.
Puis, on compte, pour le brevet correspondant à l’identifiant saisi, le nombre de classes qui, une fois tronquées sont identiques. Pour effectuer le décompte informatiquement, on peut utiliser un algorithme de tri connu de l’homme du métier. Then, for the patent corresponding to the identifier entered, we count the number of classes which, once truncated, are identical. To perform the count by computer, a sorting algorithm known to those skilled in the art can be used.
Le premier ensemble de mots-clés est déterminé en fonction de l’intitulé de la classe tronquée apparaissant le plus grand nombre de fois.
Préférentiellement, l’étape d’évaluation, l’étape de troncature et l’étape de décompte sont appliquées à chaque autre brevet de la première base de données et plus particulièrement ceux présentant un titulaire correspondant. The first set of keywords is determined based on the title of the truncated class occurring the most times. Preferably, the evaluation step, the truncation step and the counting step are applied to each other patent of the first database and more particularly those having a corresponding holder.
On appelle titulaire correspondant, des titulaires dont le nom est le même et/ou dont un identifiant national unique, par exemple le numéro du système d’identification du répertoire des entreprises (d’acronyme « SIREN ») est le même. Dans d’autres modes de réalisation, deux titulaires sont considérées comme correspondants si, après application d’un algorithme de calcul d’une proximité sémantique, la proximité sémantique est supérieure à une valeur limite prédéterminée, par exemple égale à 90% de la valeur maximale de proximité sémantique. We call corresponding holder, holders whose name is the same and / or whose unique national identifier, for example the number of the identification system of the business register (acronym "SIREN") is the same. In other embodiments, two holders are considered as corresponding if, after applying an algorithm for calculating a semantic proximity, the semantic proximity is greater than a predetermined limit value, for example equal to 90% of the value maximum semantic proximity.
Dans des modes de réalisation, le procédé 40 comporte une étape d’uniformisation des données informatiques représentatives de titulaires stockées dans la première base de données. L’étape d’uniformisation, connue de l’homme du métier, peut, par exemple, mettre chaque caractère en minuscule, enlever les caractères spéciaux, enlever les accents. In some embodiments, the method 40 includes a step of standardizing the computer data representative of holders stored in the first database. The standardization step, known to those skilled in the art, can, for example, put each character in lowercase, remove special characters, remove accents.
Dans des modes de réalisation, en cas d’égalité entre le nombre d’occurrences, l’étape d’évaluation comporte, une étape de décompte du nombre d’occurrences de chaque classe tronquée parmi chaque brevet, de la première base de données présentant un titulaire correspondant. Le premier ensemble de mots-clés est déterminé en fonction de l’intitulé de la classe tronquée apparaissant le plus grand nombre de fois. In some embodiments, in the event of equality between the number of occurrences, the evaluation step comprises, a step of counting the number of occurrences of each truncated class among each patent, of the first database presenting a corresponding holder. The first set of keywords is determined based on the title of the truncated class occurring the most times.
Pour associer, au moins un brevet au brevet dont l’identifiant est saisi, l’étape d’évaluation est appliquée à chaque brevet de la première base de données. Puis, la classe prédominante peut être stockée dans un champ de la première base de données. Le premier ensemble de mots-clés associé au brevet donc l’identifiant est saisi présente alors une proximité sémantique élevée avec les autres brevets de la première base de données de même classe prédominante. To associate at least one patent with the patent whose identifier is entered, the evaluation step is applied to each patent in the first database. Then, the predominant class can be stored in a field of the first database. The first set of keywords associated with the patent so the identifier is entered then has a high semantic proximity to the other patents of the first database of the same predominant class.
Dans des modes de réalisation, chaque étape d’évaluation est réalisée lors de la construction de la première base de données. Et le champ correspondant au domaine technique évalué est mis à jour lors de mises à jour d’au moins une classe associée à un brevet de la première base de données. In some embodiments, each evaluation step is performed during the construction of the first database. And the field corresponding to the technical area evaluated is updated when updating at least one class associated with a patent from the first database.
Dans des modes de réalisation, l’étape d’association 41 associe au moins un autre brevet de la première base de données correspondant au titulaire du brevet dont l’identifiant est saisi. Dans ces modes de réalisation, un titulaire correspondant est déterminé comme indiqué ci-dessus. In embodiments, the association step 41 associates at least one other patent from the first database corresponding to the owner of the patent whose identifier is entered. In these embodiments, a corresponding holder is determined as indicated above.
Dans des modes de réalisation, l’étape d’association 41 associe au moins un autre brevet de la première base de données correspondant au premier ensemble de mots-clés de l’identifiant saisi et à un titulaire correspondant. Ces modes de réalisation sont une combinaison des modes de réalisation détaillés ci-dessus. In embodiments, the association step 41 associates at least one other patent from the first database corresponding to the first set of keywords of the entered identifier and a corresponding holder. These embodiments are a combination of the embodiments detailed above.
Le procédé 40 comporte une étape de décompte 42 du nombre d’occurrences de chaque code représentatif de la portée géographique en fonction de chaque autre brevet associé brevet dont l’identifiant est saisi. The method 40 includes a counting step 42 of the number of occurrences of each code representative of the geographical scope according to each other associated patent patent whose identifier is entered.
Lors de l’étape de décompte 42, le contenu du champ comportant la zone géographique couverte par le brevet est soumis à un algorithme de tri connu de l’homme du métier pour décompter et classer les zones géographiques par nombre d’occurrences décroissantes. Le classement est stocké temporairement.
Dans des modes de réalisation, les brevets soumis à l’algorithme de tri sont filtrés par titulaire, par exemple, pour les titulaires correspondants ou encore pour les titulaires de même nationalité. During the counting step 42, the content of the field comprising the geographical area covered by the patent is subjected to a sorting algorithm known to those skilled in the art in order to count and classify the geographical areas by decreasing number of occurrences. The ranking is stored temporarily. In some embodiments, the patents submitted to the sorting algorithm are filtered by holder, for example, for the corresponding holders or even for holders of the same nationality.
Dans des modes de réalisation, l’étape de décompte comporte : In some embodiments, the counting step comprises:
- une étape de sélection d’une valeur prédéterminée X de titulaires classés par nombre d’occurrences décroissantes, - a step of selecting a predetermined value X of holders classified by decreasing number of occurrences,
- une étape de décompte 22 du nombre de titres de propriété industrielle de la première base de données de même domaine technique pour chaque titulaire sélectionné, - a counting step 22 of the number of industrial property titles in the first database in the same technical field for each selected holder,
- une étape de classement 23 de chaque zone par nombre d’occurrences décroissantes. - a classification step 23 of each zone by decreasing number of occurrences.
Lors de l’étape de sélection, un opérateur spécifie, au moyen d’une interface homme/machine, par exemple un clavier, une souris ou un écran tactile, le nombre de titulaires X à prendre en compte. Dans des modes de réalisation, un choix de valeurs prédéterminées X peut être proposé à l’utilisateur, par exemple, trois, cinq ou dix. During the selection step, an operator specifies, by means of a man / machine interface, for example a keyboard, a mouse or a touch screen, the number of holders X to be taken into account. In embodiments, a choice of predetermined X values may be offered to the user, for example, three, five, or ten.
Lors de l’étape de décompte 20, les titulaires correspondants sont considérés comme étant le même titulaire. During counting step 20, the corresponding holders are considered to be the same holder.
Les X titulaires les plus récurrents sont sélectionnés. Un filtrage de la première base de données est effectué pour exclure les titulaires autres que les titulaires sélectionnés. The X most recurring holders are selected. A filtering of the first database is performed to exclude holders other than the selected holders.
Puis pour chaque brevet d’au moins un des X titulaires sélectionnés, on met en oeuvre une étape de décompte similaire à l’étape de décompte 42 et indépendante du titulaire du brevet. Then for each patent of at least one of the X selected owners, a counting step similar to counting step 42 and independent of the patent holder is implemented.
La liste triée est stockée dans une mémoire au moins temporairement. The sorted list is stored in memory at least temporarily.
Lors de l’étape de pondération 43, chaque statistique nationale du jeu de statistiques nationales sélectionné est pondérée en fonction du nombre d’occurrences. Par exemple, la pondération peut suivre une loi linéaire en fonction du nombre d’occurrences. In weighting step 43, each national statistic in the selected set of national statistics is weighted according to the number of occurrences. For example, the weighting can follow a linear law depending on the number of occurrences.
Dans des modes réalisation, chaque statistique nationale est associée à une zone géographique de portée, le procédé 40 comporte, de plus ; In embodiments, each national statistic is associated with a geographic area of scope, method 40 further comprises;
- une étape de définition 44 d’une valeur limite prédéterminée, - a definition step 44 of a predetermined limit value,
- une étape de classement 45 de chaque statistique nationale du jeu de statistiques nationales sélectionné par zone géographique et par valeur décroissante, - a classification step 45 of each national statistic from the set of national statistics selected by geographic area and by decreasing value,
- une étape itérative de calcul 46 de la somme de chaque statistique nationale, par ordre de classement, jusqu’à ce que la valeur de la somme soit supérieure ou égale à la valeur limite prédéterminée, et - an iterative step 46 of calculating the sum of each national statistic, in order of classification, until the value of the sum is greater than or equal to the predetermined limit value, and
- lors de l’étape de fourniture 18, les statistiques nationales fournies sont les statistiques nationales utilisées lors de la dernière itération de l’étape de calcul. - in the supply step 18, the national statistics provided are the national statistics used in the last iteration of the calculation step.
Lors de l’étape de définition 44, un opérateur inscrit une valeur limite prédéterminée au moyen d’une interface homme/machine, par exemple en déplaçant un curseur représentant un pourcentage de marché visé allant de zéro pour cent à cent pour cent. La première valeur limite prédéterminée est ensuite calculée à partir de la valeur du marché sur l’ensemble des zones géographiques. During the definition step 44, an operator enters a predetermined limit value by means of a man / machine interface, for example by moving a cursor representing a target market percentage ranging from zero percent to one hundred percent. The first predetermined limit value is then calculated from the market value over all geographic areas.
Lors de l’étape de classement 45, un algorithme de tri est mis en oeuvre pour classer les zones géographiques en fonction de la valeur de la donnée statistique nationale de manière décroissante. L’étape de classement 45 est préférentiellement mise en oeuvre par un serveur applicatif. During the ranking step 45, a sorting algorithm is implemented to rank the geographical areas according to the value of the national statistical data in a decreasing manner. The classification step 45 is preferably implemented by an application server.
Lors de l’étape de calcul 46, on vérifie si la valeur de la zone géographique classée selon le premier rang est supérieure à la valeur limite prédéterminée. Le cas échéant, on passe à l’étape de
fourniture 18. Sinon, on calcule la somme de la statistique nationale correspondante à la zone géographique classée au premier rang avec la statistique nationale correspondante à la zone géographique classé au deuxième rang. Si la somme est supérieure à la valeur limite prédéterminée, on passe à l’étape de fourniture 18, sinon on réitère le calcul avec la statistique nationale correspondante à la zone géographique du troisième rang. L’étape de calcul 46 est ainsi itérée jusqu’à ce que la somme soit supérieure à la valeur limite prédéterminée. During the calculation step 46, it is checked whether the value of the geographical area classified according to the first rank is greater than the predetermined limit value. If necessary, we go to the step of supply 18. Otherwise, we calculate the sum of the national statistics corresponding to the geographical area ranked first with the national statistics corresponding to the geographical area ranked second. If the sum is greater than the predetermined limit value, one passes to the supply step 18, otherwise the calculation is repeated with the national statistics corresponding to the geographical area of the third rank. The calculation step 46 is thus iterated until the sum is greater than the predetermined limit value.
Les zones géographiques les plus récurrentes classées par récurrence décroissante. La liste triée est stockée dans une mémoire au moins temporairement. The most recurring geographic areas classified by decreasing recurrence. The sorted list is stored in memory at least temporarily.
L’étape de fourniture 18 peut comporter une étape d’affichage réalisée sur un écran, par exemple, au moyen d’un navigateur internet affichant une page internet sécurisée en faisant appel à la hiérarchisation fournie. L’affichage peut être sous forme de carte ou de liste, par exemple.
The supply step 18 may include a display step performed on a screen, for example, by means of an internet browser displaying a secure web page by using the hierarchy provided. The display can be in the form of a map or a list, for example.