FR3093201A1 - PROCEDURE FOR PROVIDING RELEVANT INFORMATION ASSOCIATED WITH A PATENT - Google Patents
PROCEDURE FOR PROVIDING RELEVANT INFORMATION ASSOCIATED WITH A PATENT Download PDFInfo
- Publication number
- FR3093201A1 FR3093201A1 FR1906931A FR1906931A FR3093201A1 FR 3093201 A1 FR3093201 A1 FR 3093201A1 FR 1906931 A FR1906931 A FR 1906931A FR 1906931 A FR1906931 A FR 1906931A FR 3093201 A1 FR3093201 A1 FR 3093201A1
- Authority
- FR
- France
- Prior art keywords
- national
- statistics
- information
- keywords
- representative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
PROCÉDÉ DE FOURNITURE D’UNE INFORMATION PERTINENTE ASSOCIÉE À UN BREVET Le procédé (10) de fourniture d’une information pertinente associée à un brevet qui comporte une étape de saisie (11) d’un identifiant de brevet, comporte les étapes suivantes :- conversion (12) de l’identifiant en un premier ensemble de mots-clés représentant un domaine technique, dans une première base de données associant un identifiant à un ensemble de mots-clés ;- création (13) d’une requête de collecte d’informations statistiques, en fonction des mots-clés résultant de la conversion et, pour chaque dite information, un deuxième ensemble de mots-clés associés à ladite information,- comparaison (14) des ensembles mots-clés,- d’affectation (15) d’un poids à chaque information collectée en fonction du résultat de la comparaison,- hiérarchisation (16) du jeu de statistiques en fonction du poids de chaque information,- sélection (17) d’un jeu de statistiques parmi les jeux de statistiques hiérarchisées et- fourniture (18) de chaque statistique du jeu de statistiques sélectionnée. Figure pour l'abrégé : figure 1PROCESS FOR PROVIDING RELEVANT INFORMATION ASSOCIATED WITH A PATENT The method (10) for providing relevant information associated with a patent which comprises a step of entering (11) a patent identifier, comprises the following steps: - conversion (12) of the identifier into a first set of keywords representing a technical field, in a first database associating an identifier with a set of keywords; - creation (13) of a request for the collection of 'statistical information, as a function of the keywords resulting from the conversion and, for each said information, a second set of keywords associated with said information, - comparison (14) of the sets of keywords, - of assignment (15 ) a weight for each item of information collected as a function of the result of the comparison, - prioritization (16) of the set of statistics as a function of the weight of each item of information, - selection (17) of a set of statistics from among the sets of statistics hierarchical and re (18) of each statistic in the selected statistic set. Figure for abstract: figure 1
Description
La présente invention vise un procédé de fourniture de fourniture d’une information pertinente associée à un brevet. Elle s’applique, notamment, la recherche dans des bases de données et à l’enrichissement de requêtes dans des bases de données de brevets avec des données statistiques nationales. De plus, la présente invention s’applique à la détection automatique de comportements d’utilisateurs en matière d’extensions de brevets.The present invention relates to a method for providing relevant information associated with a patent. It applies, in particular, to research in databases and to the enrichment of queries in patent databases with national statistical data. In addition, the present invention applies to the automatic detection of user behavior in terms of patent extensions.
Le compartimentage d’informations de types différents entraîne des difficultés de mise en relation par un utilisateur désireux de croiser des sources distinctes pour accroitre sa connaissance d’un sujet.The compartmentalization of information of different types leads to difficulties in linking by a user wishing to cross distinct sources to increase his knowledge of a subject.
De ce compartimentage résulte un risque d’absence d’identification d’une information d’une première source par l’utilisateur lorsqu’il réalise une recherche d’informations à partir d’informations issues d’une deuxième source. Il résulte, de plus, un risque d’identification d’une mauvaise information ou d’une information moins pertinente que possible en raison de choix de l’utilisateur dans la recherche de l’information. Enfin, il résulte de manière évidente d’une perte de temps liée à la recherche par l’utilisateur qui doit analyser une information d’une première source pour identifier un critère de recherche dans une deuxième source, réaliser la recherche, trier les résultats avant d’en sélectionner un.This compartmentalization results in a risk of non-identification of information from a first source by the user when he searches for information based on information from a second source. There is also a risk of identifying incorrect information or information that is less relevant than possible due to the user's choice in the search for information. Finally, it obviously results from a waste of time linked to the search by the user who must analyze information from a first source to identify a search criterion in a second source, carry out the search, sort the results before to select one.
Les bases de données répertoriant les brevets d’invention ne sont pas reliées aux bases de données d’informations statistiques relatives aux pays, telles par exemple des informations de type macro-économiques, dès que ces informations ne sont pas directement liées aux statistiques traitant des brevets. Il découle, de cette compartimentation de l’information, une difficulté à articuler les informations de type brevets aux autres informations pourtant nécessaires dans l’élaboration d’un choix stratégique lié aux brevets. Un tel choix est, par exemple, l’extension géographique d’une demande de brevet sous couvert du droit de priorité ou lors d’une sortie de demande PCT. Un tel choix requiert le croisement d’informations représentatives du potentiel de marché de la demande de brevet, de données budgétaires.Databases listing invention patents are not linked to databases of statistical information relating to countries, such as macro-economic information, for example, as soon as this information is not directly linked to statistics dealing with patents. This compartmentalization of information makes it difficult to articulate patent-type information with other information that is nevertheless necessary in the development of a strategic choice related to patents. Such a choice is, for example, the geographical extension of a patent application under cover of the right of priority or during a PCT application exit. Such a choice requires the cross-referencing of information representative of the market potential of the patent application, with budgetary data.
La présente invention vise à remédier à tout ou partie de ces inconvénients.The present invention aims to remedy all or part of these drawbacks.
À cet effet, la présente invention vise un procédé de fourniture d’une information pertinente associée à un brevet comportant une étape de saisie d’au moins un identifiant de brevet d’invention, qui comporte :
- une étape de conversion de l’identifiant saisi en un premier ensemble de mots-clés représentatifs d’au moins un domaine technique du brevet, dans une première base de données associant au moins un identifiant à un ensemble de mots-clés ;
- une étape de création d’une requête de collecte d’informations représentatives d’un jeu de statistiques nationales, accessibles sur un réseau, en fonction des mots-clés résultant de la conversion et, pour chaque dite information, un deuxième ensemble de mots-clés associés à ladite information,
- une étape de comparaison du premier ensemble de mots-clés et de chaque deuxième ensemble,
- une étape d’affectation d’un poids à chaque information représentative du jeu de statistiques nationales collectée en fonction du résultat de la comparaison,
- une étape de hiérarchisation du jeu de statistiques nationales en fonction du poids de chaque dite information,
- une étape de sélection d’au moins un jeu de statistiques nationales parmi les jeux de statistiques nationales hiérarchisées et
- une étape de fourniture de chaque dite statistique nationale du jeu de statistiques nationales sélectionnée.To this end, the present invention is aimed at a method for providing relevant information associated with a patent comprising a step of entering at least one invention patent identifier, which comprises:
- a step of converting the entered identifier into a first set of keywords representative of at least one technical field of the patent, in a first database associating at least one identifier with a set of keywords;
- a step of creating a request for collecting information representative of a set of national statistics, accessible on a network, according to the keywords resulting from the conversion and, for each said piece of information, a second set of words -keys associated with said information,
- a step of comparing the first set of keywords and each second set,
- a step of assigning a weight to each piece of information representative of the set of national statistics collected according to the result of the comparison,
- a stage of prioritization of the set of national statistics according to the weight of each said piece of information,
- a step of selecting at least one set of national statistics from among the sets of hierarchical national statistics and
- a step of supplying each said national statistics of the set of national statistics selected.
Grâce à ces dispositions, une requête, dans une base de données de brevet, est enrichie, en fonction de mots-clés associés au brevet de statistiques nationales, supranationales ou infranationales correspondantes, de manière automatique et fiable de sorte qu’un utilisateur puisse recevoir rapidement des informations fiables. De telles informations permettent, notamment, d’effectuer un choix avisé d’extension internationale d’une demande de brevet, par exemple.Thanks to these provisions, a query in a patent database is enriched, according to keywords associated with the patent, with corresponding national, supranational or subnational statistics, automatically and reliably so that a user can receive reliable information quickly. Such information makes it possible, in particular, to make an informed choice of international extension of a patent application, for example.
Dans des modes de réalisation, le procédé objet de la présente invention comporte, en amont de l’étape de saisie, une étape de construction de la première base de données qui comporte :
- une étape de collecte et d’indexation d’identifiants publics d’au moins un brevet et
- une étape d’association, à chaque brevet dont les données publiques sont indexées, au moins une information représentative d’au moins un mot-clé.In some embodiments, the method that is the subject of the present invention comprises, upstream of the entry step, a step for constructing the first database which comprises:
- a step of collecting and indexing public identifiers of at least one patent and
- a step of associating, with each patent whose public data is indexed, at least one item of information representative of at least one keyword.
Ces modes de réalisation permettent de créer une nouvelle base de données de recherche utilisant les données publiques disponibles associées à des mots-clés pertinents en matière de domaine technique de l’invention.These embodiments make it possible to create a new search database using available public data associated with relevant keywords in the technical field of the invention.
Dans des modes de réalisation, l’information est représentative d’au moins un intitulé d’une classe technique associé à un ensemble de mots-clés.In embodiments, the information is representative of at least one title of a technical class associated with a set of keywords.
Ces modes de réalisation permettent de déduire d’une classe internationale ou coopérative de brevets des mots-clés représentant techniquement le domaine d’application du brevet recherché. De tels mots-clés peuvent être associés via une table de correspondance, par exemple.These embodiments make it possible to deduce from an international or cooperative class of patents keywords that technically represent the field of application of the patent sought. Such keywords can be associated via a correspondence table, for example.
Dans des modes de réalisation, l’information est représentative d’au moins une partie du contenu du brevet.In embodiments, the information is representative of at least a portion of the content of the patent.
Grâce à ces dispositions, les mots-clés sont déduits du contenu du brevet pour correspondre plus précisément au brevet concerné. Le contenu peut ici faire référence à la description, aux revendications ou à l’abrégé, par exemple.Thanks to these provisions, the keywords are deduced from the content of the patent to correspond more precisely to the patent concerned. The content here can refer to the description, claims or abstract, for example.
Dans des modes de réalisation, l’étape de construction de la première base de données comporte une étape de création d’une arborescence, reliant au moins deux identifiants de brevets, l’information représentative d’au moins un mot-clé étant associée en fonction de chaque identifiant relié à l’identifiant saisi lors de l’étape de saisie.In some embodiments, the step of constructing the first database includes a step of creating a tree structure, linking at least two patent identifiers, the information representative of at least one keyword being associated in function of each identifier linked to the identifier entered during the entry step.
Ces modes de réalisation permettent de lier des brevets par famille de brevets, par exemple en fonction d’une priorité revendiquée selon la convention de l’union de Paris. Des familles de brevets peuvent donc être créées, les informations contenues dans la base de données d’un brevet pouvant enrichir une requête formulée en ce qui concerne un brevet de la même famille.These embodiments make it possible to link patents by family of patents, for example according to a priority claimed according to the convention of the Paris union. Patent families can therefore be created, the information contained in the database of a patent being able to enrich a query formulated with regard to a patent of the same family.
Dans des modes de réalisation, le procédé objet de la présente invention qui comporte une étape d’extrapolation d’une statistique nationale d’un jeu de statistiques nationales présentant une statistique nationale manquante, chaque valeur obtenue par extrapolation étant associée au deuxième ensemble de mots-clés de l’information représentative du jeu de statistiques nationales de la valeur extrapolée.In embodiments, the method that is the subject of the present invention which comprises a step of extrapolating a national statistic from a set of national statistics presenting a missing national statistic, each value obtained by extrapolation being associated with the second set of words -key information representative of the set of national statistics of the extrapolated value.
Ces modes de réalisation permettent d’extrapoler des statistiques nationales si une ou plusieurs statistique nationale est manquante d’un jeu de statistiques nationales.These embodiments make it possible to extrapolate national statistics if one or more national statistics is missing from a set of national statistics.
Dans des modes de réalisation, le procédé objet de la présente invention comporte une étape de construction de la deuxième base de données comportant :
- une étape de collecte et d’indexation de jeux de statistiques nationales,
- une étape d’association, à chaque jeu de statistiques nationales indexé, au moins une information représentative d’au moins un mot-clé.In some embodiments, the method that is the subject of the present invention comprises a step of building the second database comprising:
- a step of collecting and indexing sets of national statistics,
- a step of associating, with each set of indexed national statistics, at least one item of information representative of at least one keyword.
Ces modes de réalisation permettent de construire une base de données de statistiques nationales disparates.These embodiments make it possible to construct a database of disparate national statistics.
Dans des modes de réalisation, les jeux de statistiques nationales sont organisés dans au moins une arborescence comportant au moins deux niveaux, un niveau dit « supérieur » auquel est rattaché un niveau dit « inférieur » comportant plusieurs jeux de statistiques nationales, le jeu de statistique nationale du niveau supérieur étant égal à la somme des jeux de valeurs du niveau inférieur.In some embodiments, the sets of national statistics are organized in at least one tree structure comprising at least two levels, a so-called "upper" level to which is attached a so-called "lower" level comprising several sets of national statistics, the set of statistics value of the higher level being equal to the sum of the sets of values of the lower level.
Ces modes de réalisation permettent de faire correspondre une classification de brevets à une classification de données statistiques nationales.These embodiments make it possible to match a classification of patents to a classification of national statistical data.
Dans des modes de réalisation, lors de l’étape d’extrapolation, une statistique nationale est extrapolée en fonction du jeu de statistiques nationales d’un niveau supérieur.In embodiments, during the extrapolation step, a national statistic is extrapolated based on the higher level set of national statistics.
Grâce à ces dispositions, l’extrapolation de statistiques nationales est cohérente avec les autres jeux de statistiques nationales d’une même arborescence.Thanks to these provisions, the extrapolation of national statistics is consistent with the other sets of national statistics in the same tree structure.
Dans des modes de réalisation, les jeux de statistiques nationales sont organisés selon deux arborescences distinctes, une statistique nationale d’une arborescence étant extrapolée en fonction d’un jeu de statistiques nationales d’une autre arborescence.In embodiments, the sets of national statistics are organized according to two distinct trees, a national statistic of one tree being extrapolated according to a set of national statistics of another tree.
Ces modes de réalisation permettent d’extrapoler par rapport à d’autres jeux de statistiques nationales liées, mais dans deux arborescences distinctes.These embodiments allow extrapolation against other sets of related national statistics, but in two separate trees.
Dans des modes de réalisation, la première base de données comporte pour chaque brevet, une identification d’au moins un titulaire et un code représentatif de la portée géographique, le procédé comporte, de plus :
- une étape d’association d’au moins un autre brevet de la première base de données correspondant au premier ensemble de mots-clés de l’identifiant saisi et/ou au titulaire du titre,
- une étape de décompte du nombre d’occurrences de chaque code représentatif de la portée géographique en fonction de chaque autre brevet associé brevet dont l’identifiant est saisi;
- une étape de pondération de chaque statistique nationale du jeu de statistiques nationales sélectionné en fonction du nombre d’occurrences,
- lors de l’étape de fourniture, le jeu de statistiques nationales est classé par pondération décroissante.In embodiments, the first database comprises, for each patent, an identification of at least one holder and a code representative of the geographical scope, the method further comprises:
- a step of associating at least one other patent from the first database corresponding to the first set of keywords of the identifier entered and/or to the holder of the title,
- a step of counting the number of occurrences of each code representative of the geographical scope as a function of each other patent associated patent whose identifier is entered;
- a step of weighting each national statistic of the set of national statistics selected according to the number of occurrences,
- during the supply stage, the set of national statistics is classified by decreasing weighting.
Grâce à ces dispositions, le comportement de gestionnaires dans des situations similaires est modélisé et permet de déduire, pour le gestionnaire en charge du titre de propriété industrielle étudié, une stratégie adéquate en fonction des comportements observés pour limiter les coûts et optimiser les décisions prises.Thanks to these provisions, the behavior of managers in similar situations is modeled and makes it possible to deduce, for the manager in charge of the industrial property title studied, an appropriate strategy according to the behavior observed to limit costs and optimize the decisions taken.
Dans des modes de réalisation, chaque statistique nationale est associée à une zone géographique de portée, le procédé comporte, de plus ;
- une étape de définition d’une valeur limite prédéterminée,
- une étape de classement de chaque statistique nationale du jeu de statistiques nationales sélectionné par zone géographique et par valeur décroissante,
- une étape itérative de calcul de la somme de chaque statistique nationale, par ordre de classement, jusqu’à ce que la valeur de la somme soit supérieure ou égale à la valeur limite prédéterminée, et
- lors de l’étape de fourniture, les statistiques nationales fournies sont les statistiques nationales utilisées lors de la dernière itération de l’étape de calcul.In embodiments, each national statistic is associated with a geographic area of scope, the method further comprises;
- a step of defining a predetermined limit value,
- a stage of classification of each national statistic of the set of national statistics selected by geographical area and by decreasing value,
- an iterative step of calculating the sum of each national statistic, in order of classification, until the value of the sum is greater than or equal to the predetermined limit value, and
- during the supply step, the national statistics provided are the national statistics used during the last iteration of the calculation step.
Ces modes de réalisation permettent d’enrichir la requête avec des zones géographiques.These embodiments make it possible to enrich the query with geographical areas.
D’autres avantages, buts et caractéristiques particulières de l’invention ressortiront de la description non limitative qui suit d’au moins un mode de réalisation particulier du procédé objet de la présente invention, en regard des dessins annexés, dans lesquels :Other advantages, aims and particular characteristics of the invention will emerge from the non-limiting description which follows of at least one particular embodiment of the method which is the subject of the present invention, with reference to the appended drawings, in which:
DESCRIPTION D’EXEMPLES DE RÉALISATION DE L’INVENTIONDESCRIPTION OF EXAMPLES OF EMBODIMENT OF THE INVENTION
La présente description est donnée à titre non limitatif, chaque caractéristique d’un mode de réalisation pouvant être combinée à toute autre caractéristique de tout autre mode de réalisation de manière avantageuse.This description is given on a non-limiting basis, each characteristic of an embodiment being able to be combined with any other characteristic of any other embodiment in an advantageous manner.
On note dès à présent que les figures ne sont pas à l’échelle.Note that the figures are not to scale.
On note, ici, que le terme « brevet » désigne à la fois une demande de brevet, un brevet délivré, un certificat d’utilité et tout autre titre de propriété industrielle classifié selon l’une des classifications techniques de brevets, parmi lesquelles notamment la CIB (pour « Classification Internationale des Brevets ») et la CCB (pour « Classification Coopérative des Brevets », connue en anglais sous le sigle CPC, pour « Cooperative Patent Classification »).It should be noted here that the term "patent" designates both a patent application, a granted patent, a utility certificate and any other industrial property title classified according to one of the technical patent classifications, including in particular the CIB (for “International Classification of Patents”) and the CCB (for “Cooperative Classification of Patents”, known in English under the acronym CPC, for “Cooperative Patent Classification”).
On note que le terme « statistiques nationales » se réfère à toute donnée caractérisant un pays ou un groupement de pays. Cette donnée peut être représentative d’une activité économique, d’un état politique ou juridique ou représentative de la population d’un pays par exemple. Ces exemples sont donnés à titre non limitatifs. Par extension, un jeu de statistiques nationales est un ensemble de valeurs numériques représentant une même entité, sur plusieurs périodes temporelles et/ou zones géographiques. On note qu’une période temporelle est une durée de longueur prédéfinie, par exemple une année ou un mois. On note également qu’une zone géographique est définie par la délimitation des frontières d’un pays ou d’un groupement de pays.It should be noted that the term “national statistics” refers to any data characterizing a country or a group of countries. This data can be representative of an economic activity, a political or legal state or representative of the population of a country, for example. These examples are given without limitation. By extension, a set of national statistics is a set of numerical values representing the same entity, over several time periods and/or geographical areas. Note that a time period is a duration of predefined length, for example a year or a month. We also note that a geographical area is defined by the delimitation of the borders of a country or a group of countries.
On appelle « apprentissage automatique » toute technologie d’approche statistique permettant à un programme d’ordinateur d’améliorer sa performance pour résoudre une tâche sans que cette augmentation de performance soit le fait d’une programmation explicite. L’apprentissage automatique considéré peut mettre en œuvre tout algorithme connu de l’Homme du Métier pour parvenir à l’objectif pour lequel il est appliqué.“Machine learning” is any statistical approach technology that allows a computer program to improve its performance in solving a task without this increase in performance being the result of explicit programming. The machine learning considered can implement any algorithm known to those skilled in the art to achieve the objective for which it is applied.
On note que le premier et le deuxième terminal informatique peuvent être confondus.It is noted that the first and the second computer terminal can be confused.
On observe, sur la figure 1, un logigramme d’étapes d’un premier mode de réalisation particulier du procédé 10 objet de la présente invention. Le procédé 10 de fourniture d’une information pertinente associée à un brevet qui comporte une étape de saisie 11 d’au moins un identifiant de brevet d’invention, comporte :
- une étape de conversion 12 de l’identifiant saisi en un premier ensemble de mots-clés représentatifs d’au moins un domaine technique du brevet, dans une première base de données associant au moins un identifiant à un ensemble de mots-clés ;
- une étape de création 13 d’une requête de collecte d’informations représentatives d’un jeu de statistiques nationales, accessibles sur un réseau, en fonction des mots-clés résultant de la conversion et, pour chaque dite information, un deuxième ensemble de mots-clés associés à ladite information,
- une étape de comparaison 14 du premier ensemble de mots-clés et de chaque deuxième ensemble,
- une étape d’affectation 15 d’un poids à chaque information représentative du jeu de statistiques nationales collectée en fonction du résultat de la comparaison,
- une étape de hiérarchisation 16 du jeu de statistiques nationales en fonction du poids de chaque dite information,
- une étape de sélection 17 d’au moins un jeu de statistiques nationales parmi les jeux de statistiques nationales hiérarchisées et
- une étape de fourniture 18 de chaque dite statistique nationale du jeu de statistiques nationales sélectionnée.FIG. 1 shows a flowchart of steps of a first particular embodiment of the method 10 which is the subject of the present invention. The method 10 for supplying relevant information associated with a patent which comprises a step 11 of inputting at least one invention patent identifier, comprises:
- a step 12 of converting the entered identifier into a first set of keywords representative of at least one technical field of the patent, in a first database associating at least one identifier with a set of keywords;
- a step 13 of creating a request for collecting information representative of a set of national statistics, accessible on a network, according to the keywords resulting from the conversion and, for each said piece of information, a second set of keywords associated with said information,
- a comparison step 14 of the first set of keywords and of each second set,
- a step 15 of assigning a weight to each item of information representative of the set of national statistics collected according to the result of the comparison,
- a step 16 for prioritizing the set of national statistics according to the weight of each said piece of information,
- a step 17 of selecting at least one set of national statistics from among the sets of hierarchical national statistics and
- a step 18 of supplying each said national statistics of the set of national statistics selected.
L’étape de saisie 11 est effectuée au moyen d’un premier terminal informatique comportant une interface homme/machine, par exemple un clavier ou un écran tactile. Lors de l’étape de saisie 11 un opérateur insère dans un champ de saisie une suite de caractères alphanumériques représentant un identifiant d’un brevet. Un opérateur saisit, par exemple, un numéro de demande ou de publication d’un brevet. Par exemple, l’identifiant du brevet peut être un code composé de deux lettres représentatives d’une zone géographique et d’un ensemble de caractères numériques représentatifs d’un numéro de demande.The input step 11 is performed by means of a first computer terminal comprising a man/machine interface, for example a keyboard or a touch screen. During input step 11, an operator inserts into an input field a sequence of alphanumeric characters representing a patent identifier. An operator enters, for example, a patent application or publication number. For example, the patent identifier can be a code composed of two letters representing a geographical area and a set of numeric characters representing an application number.
Dans des modes de réalisation, l’identifiant correspond au numéro de publication, au numéro de dépôt ou au numéro de délivrance d’un brevet ou d’une demande de brevet. Préférentiellement, chaque titre de propriété industrielle de la première base de données comporte un champ représentatif de la zone géographique, pays ou région, couverte par le titre. La forme d’un identifiant de brevet est connue de l’homme du métier. L’étape de saisie 11 peut comporter une étape d’affichage d’une saisie prédictive (autrement appelée « saisie intuitive ») connue de l’homme du métier.In embodiments, the identifier corresponds to the publication number, application number or grant number of a patent or patent application. Preferably, each industrial property title of the first database comprises a field representative of the geographical area, country or region, covered by the title. The form of a patent identifier is known to those skilled in the art. The entry step 11 may include a step for displaying a predictive entry (otherwise called "intuitive entry") known to those skilled in the art.
Lors de l’étape de conversion 12, l’identifiant saisi est associé à au moins un mot-clé dans la première base de données. La construction de la première base de données est décrite en regard du logigramme de la figure 2.During the conversion step 12, the identifier entered is associated with at least one keyword in the first database. The construction of the first database is described with regard to the flowchart of figure 2.
L’étape de construction 21 de la première base de données comporte :The construction step 21 of the first database includes:
- une étape de collecte 22 et d’indexation d’identifiants publics d’au moins un brevet et- a step of collecting 22 and indexing public identifiers of at least one patent and
- une étape d’association 23, à chaque brevet dont les données publiques sont indexées, au moins une information représentative d’au moins un mot-clé.- an association step 23, with each patent whose public data is indexed, at least one piece of information representative of at least one keyword.
L’étape de collecte 22 est réalisée, par exemple, par la mise en œuvre d’un circuit électronique de calcul, de type ordinateur ou serveur informatique, configuré pour recevoir via un moyen de communication, telle une carte réseau par exemple, des identifiants publics de brevets.The collection step 22 is carried out, for example, by the implementation of an electronic calculation circuit, of the computer or computer server type, configured to receive via a means of communication, such as a network card for example, identifiers patent public.
Lors de l’étape de collecte 22 et d’indexation, plusieurs bases de données de brevets publiques de brevets sont collectées et assemblées. Chaque brevet est défini par une donnée informatique représentative d’un identifiant unique.During the collection 22 and indexing step, several public patent databases of patents are collected and assembled. Each patent is defined by computer data representing a unique identifier.
Dans des modes de réalisation, le procédé objet de la présente invention comporte une pluralité d’étapes de collecte 22 de données. Une telle pluralité d’étapes de collecte 22 peut correspondre soit à la collecte successive d’un type de données identique et/ou à un la collecte de plusieurs types de données distinctes.In some embodiments, the method that is the subject of the present invention comprises a plurality of data collection steps 22 . Such a plurality of collection steps 22 can correspond either to the successive collection of an identical type of data and/or to the collection of several distinct types of data.
Préférentiellement, chaque brevet est associé à au moins une des caractéristiques suivantes :
- une donnée informatique représentative d’un titulaire du titre dite « titulaire »,
- une donnée informatique représentative d’au moins une classe technique dite « classe »,
- un mandataire,
- un numéro de priorité,
- une date de priorité,
- l’identification d’au moins un inventeur,
- une date de dépôt,
- un numéro de dépôt,
- une date de publication,
- un numéro de publication,
- un titre,
- au moins un document cité dans la procédure d’examen du brevet,
- un abrégé,
- une description,
- au moins une revendication et/ou
- de toute autre information connue de l’homme du métier et présente sur au moins base de données de titres de propriété industrielle.Preferably, each patent is associated with at least one of the following characteristics:
- computer data representative of a holder of the title called "holder",
- computer data representative of at least one technical class called "class",
- an agent,
- a priority number,
- a priority date,
- the identification of at least one inventor,
- a filing date,
- a deposit number,
- a publication date,
- a publication number,
- a title,
- at least one document cited in the patent examination procedure,
- an abstract,
- a description,
- at least one claim and/or
- any other information known to those skilled in the art and present on at least a database of industrial property titles.
La donnée informatique représentative d’un titulaire peut représenter, un nom, une adresse, un numéro de téléphone, une forme juridique, un numéro d’identification unique délivré par une administration gouvernementale, et/ou toute autre information représentative d’une entreprise ou d’un particulier.The computer data representative of a holder may represent a name, an address, a telephone number, a legal form, a unique identification number issued by a government administration, and/or any other information representative of a company or of an individual.
Chaque donnée informatique représentative d’au moins une classe technique peut correspondre à un élément d’une classification de brevets telles la « Classification coopérative des brevets » (d’acronyme « CPC ») ou la « Classification internationale des brevets » (d’acronyme « CIB »). Chaque code représentatif d’un domaine technique de la CPC et de la CIB comporte au moins, dans l’ordre suivant :
- une lettre représentative d’une section,
- deux chiffres représentatifs d’une classe,
- une deuxième lettre représentative d’une sous-classe,
- au moins un chiffre représentatif d’un groupe.Each computer data representative of at least one technical class may correspond to an element of a patent classification such as the "Cooperative Patent Classification" (acronym "CPC") or the "International Patent Classification" (acronym “IPC”). Each code representing a technical field of the CPC and the IPC includes at least, in the following order:
- a letter representing a section,
- two figures representing a class,
- a second letter representing a subclass,
- at least one figure representing a group.
Dans des modes de réalisation, chaque code comporte de plus, au moins deux autres chiffres séparés de chaque chiffre représentatif d’un groupe par le symbole « / ». Lesdits deux autres chiffres représentent un sous-groupe. Par exemple, la chaine alphanumérique d’une donnée représentative d’une classe technique serait « A21C1/06 ».In embodiments, each code further comprises at least two other digits separated from each digit representing a group by the symbol “/”. Said other two digits represent a subgroup. For example, the alphanumeric string of data representative of a technical class would be "A21C1/06".
L’étape d’association 23 est réalisée, par exemple, par la mise en œuvre d’un circuit électronique de calcul, de type ordinateur ou serveur informatique, configuré pour associer directement ou indirectement au moins un mot-clé à un identifiant de brevet. Une association indirecte est réalisée, par exemple, par l’association d’un indicateur de classe technique correspondant, via une table de correspondance, à un ensemble de mots-clés.The association step 23 is carried out, for example, by the implementation of an electronic calculation circuit, of the computer or computer server type, configured to directly or indirectly associate at least one keyword with a patent identifier . An indirect association is made, for example, by associating a corresponding technical class indicator, via a correspondence table, with a set of keywords.
Dans des modes de réalisation, lors de l’étape d’association 23, l’information est représentative d’au moins un intitulé d’une classe technique associé à un ensemble de mots-clés. Par exemple, la classe technique est associée, dans une autre base de données à un intitulé. Des mots-clés peuvent être extraits dudit intitulé.In embodiments, during the association step 23, the information is representative of at least one title of a technical class associated with a set of keywords. For example, the technical class is associated, in another database, with a title. Key words can be extracted from said title.
Dans des modes de réalisation, l’information est représentative d’au moins une partie du contenu du brevet. Par exemple, l’information est représentative d’au moins une partie d’une revendication, de l’agrégé, du titre ou de la description.In embodiments, the information is representative of at least a portion of the content of the patent. For example, the information is representative of at least part of a claim, aggregate, title or description.
Dans des modes de réalisation, l’information est représentative d’au moins une activité d’au moins un titulaire. Par exemple, chaque titulaire est associé à un domaine économique d’activité dans une autre base de données. Le domaine technique d’activité peut être représenté par un code selon la nomenclature d’activité française (d’acronyme « NAF ») ou tout équivalent dans d’autres pays.In embodiments, the information is representative of at least one activity of at least one holder. For example, each holder is associated with an economic field of activity in another database. The technical field of activity may be represented by a code according to the French activity nomenclature (acronym "NAF") or any equivalent in other countries.
Dans des modes de réalisation, l’information est représentative d’une combinaison des informations ci-dessus.In embodiments, the information is representative of a combination of the above information.
Dans des modes de réalisation, l’étape de construction 20 comporte une étape de création 24 d’une arborescence, reliant au moins deux identifiants de brevets, l’information représentative d’au moins un mot-clé étant associée en fonction de chaque identifiant relié à l’identifiant saisi lors de l’étape de saisie.In some embodiments, the construction step 20 comprises a step 24 for creating a tree structure, linking at least two patent identifiers, the information representative of at least one keyword being associated according to each identifier linked to the identifier entered during the entry step.
L’étape de construction 24 est réalisée, par exemple, par la mise en œuvre d’un circuit électronique de calcul, de type ordinateur ou serveur informatique, configuré pour associer en base de données plusieurs identifiants de brevets selon une règle déterminée.The construction step 24 is carried out, for example, by the implementation of an electronic calculation circuit, of the computer or computer server type, configured to associate in a database several patent identifiers according to a determined rule.
Dans des modes de réalisation, un ou plusieurs brevets peuvent être cités lors de la procédure de délivrance du brevet dont l’identifiant est saisi, reliant lesdits brevets au brevet dont l’identifiant a été saisi. Chacun desdits brevets est identifié par un identifiant unique associé à une information représentative d’au moins un mot-clé. Dans des modes de réalisation, deux identifiants de brevet sont reliés par au moins une revendication de priorité commune, ou par un titulaire commun, par exemple.In embodiments, one or more patents may be cited during the granting procedure of the patent whose identifier is entered, linking said patents to the patent whose identifier has been entered. Each of said patents is identified by a unique identifier associated with information representing at least one keyword. In embodiments, two patent identifiers are linked by at least one common priority claim, or by a common owner, for example.
Dans des modes de réalisation particuliers, tel que celui représenté en figure 2, le procédé 20 comporte, en amont de l’étape de conversion 12, une étape de lecture d’une donnée représentative d’un contenu du brevet, l’étape de conversion 12 étant réalisée en fonction des données lues.In particular embodiments, such as that represented in FIG. 2, the method 20 comprises, upstream of the conversion step 12, a step of reading data representative of a content of the patent, the step of conversion 12 being carried out according to the data read.
Une telle étape de lecture peut être réalisée, par exemple, par la mise en œuvre d’un circuit électronique de calcul configuré pour exécuter un programme informatique de lecture de documents.Such a reading step can be carried out, for example, by the implementation of an electronic calculation circuit configured to execute a computer program for reading documents.
Cette donnée représentative est, par exemple, un texte représentatif de l’abrégé du brevet sur une base de données, tel un registre de brevets. Ce contenu textuel est alors, par exemple, ajouté au premier ensemble de mots-clés, de sorte quel le calcul est alors lié au brevet qui contextualise la classe à l’application visée par le brevet.This representative data is, for example, a representative text of the abstract of the patent on a database, such as a patent register. This textual content is then, for example, added to the first set of keywords, so that the calculation is then linked to the patent which contextualizes the class to the application targeted by the patent.
Lors de l’étape de conversion 12, chaque information représentative d’au moins un mot-clé est obtenue par consultation de la première base de données. Puis, au moins un mot-clé associé à l’information est obtenu. Préférentiellement, chaque mot-clé obtenu est intégré au premier ensemble de mots-clés. L’étape de conversion 12 est réalisée, par exemple, par le serveur informatique dans une base de données associant, pour au moins un identifiant de brevet au moins une classe technique. Cette base de données est, par exemple, un registre de brevets en ligne, tels, par exemple, le registre français des brevets tenu par l’INPI (pour « Institut National de la Propriété Industrielle »), le registre européen des brevets tenu par l’OEB (pour « Office Européen des Brevets ») ou le registre des brevets des États-Unis d’Amérique tenu par l’USPTO (pour « United States Patent and Trademarks Office », traduit par Office des Brevets et des Marques des États-Unis). Cette base de données est, préférentiellement, la base DocDB tenue par l’OEB.During the conversion step 12, each piece of information representative of at least one keyword is obtained by consulting the first database. Then, at least one keyword associated with the information is obtained. Preferably, each keyword obtained is integrated into the first set of keywords. The conversion step 12 is carried out, for example, by the computer server in a database associating, for at least one patent identifier, at least one technical class. This database is, for example, an online patent register, such as, for example, the French patent register kept by the INPI (for "Institut National de la Propriété Industrielle"), the European patent register kept by the EPO (for "European Patent Office") or the United States Patent Register held by the USPTO (for "United States Patent and Trademarks Office", translated by Office des Brevets et des Marques des Etats -United). This database is preferably the DocDB database maintained by the EPO.
Dans des modes de réalisation, l’étape de conversion comporte une étape de suppression des doublons du premier ensemble de mots-clés.In embodiments, the converting step includes a step of removing duplicates from the first set of keywords.
Dans des modes de réalisation, au moins un mot-clé pour lequel l’information représentative est au moins un élément parmi une partie d’une revendication, du titre, de l’abrégé et/ou de la description est extrait dudit élément.In embodiments, at least one keyword for which the representative information is at least one of a part of a claim, title, abstract and/or description is extracted from said element.
Dans des modes de réalisation, au moins un mot-clé pour lequel l’information représentative est au moins une classe technique est extrait de l’intitulé de la classe technique.In embodiments, at least one keyword for which the representative information is at least one technical class is extracted from the title of the technical class.
Dans des modes de réalisation, au moins un mot-clé est associé à une valeur de pertinence, cette valeur de pertinence étant calculée par analyse sémantique et/ou statistique des mots-clés candidats à la conversion.In embodiments, at least one keyword is associated with a relevance value, this relevance value being calculated by semantic and/or statistical analysis of the candidate keywords for conversion.
Dans des modes de réalisation dans lesquels une arborescence est créée, l’ensemble de mots-clés comporte au moins partiellement les mots-clés d’un brevet dont l’identifiant est relié au brevet dont l’identifiant est saisi. Il y a alors une accumulation des mots-clés pour plus de précision lors de la recherche.In embodiments in which a tree structure is created, the set of keywords includes at least partially the keywords of a patent whose identifier is linked to the patent whose identifier is entered. There is then an accumulation of keywords for more precision during the search.
Le procédé d’extraction de mots-clés est connu de l’homme du métier.The method for extracting keywords is known to those skilled in the art.
Le procédé 10 comporte une étape de création 13 d’une requête de collecte d’informations représentatives d’un jeu de statistiques nationales, accessibles sur un réseau, en fonction des mots-clés résultant de la conversion et, pour chaque dite information, un deuxième ensemble de mots-clés associés à ladite information.The method 10 comprises a step 13 of creating a request for collecting information representative of a set of national statistics, accessible on a network, according to the keywords resulting from the conversion and, for each said information, a second set of keywords associated with said information.
Une requête de collecte d’informations, aussi connue sous l’appellation « requête de recherche ». Lors de l’étape de création 13 d’une requête, le premier ensemble de mots-clés est utilisé par un moteur de recherche d’informations dans la deuxième base de données. Une requête est un ensemble de mots associés à des opérateurs logiques tels que « ET », « OU », ou encore « ET/OU ». Le moteur de recherche fouille dans les données à sa disposition pour recherche les mots en fonction des opérateurs logiques définis.An information gathering request, also known as a “search request”. During step 13 of creating a query, the first set of keywords is used by an information search engine in the second database. A query is a set of words associated with logical operators such as “AND”, “OR”, or even “AND/OR”. The search engine digs into the data at its disposal to find the words according to the defined logical operators.
Préférentiellement, lors de l’étape de création 13, l’ensemble de mots est associé à un opérateur « ET/OU », c’est-à-dire que l’ensemble des mots peut apparaitre simultanément ou alternativement dans un champ de recherche.Preferably, during the creation step 13, the set of words is associated with an “AND/OR” operator, that is to say that the set of words can appear simultaneously or alternately in a search field .
La deuxième base de données est détaillée en regard de l’étape de construction 31 représentée en figure 3. L’étape de construction 31 de la deuxième base de données comporte :
- une étape de collecte et d’indexation 32 de jeux de statistiques nationales,
- une étape d’association 33, à chaque jeu de statistiques nationales indexé, au moins une information représentative d’au moins un mot-clé.The second database is detailed with regard to the construction step 31 represented in FIG. 3. The construction step 31 of the second database comprises:
- a step of collecting and indexing 32 sets of national statistics,
- A step 33 of association, with each set of indexed national statistics, at least one item of information representative of at least one keyword.
L’étape 32 de collecte et d’indexation de jeux de statistiques nationales est réalisée, par exemple, par un opérateur humain consultant une base de données ouverte de données statistiques nationales et enregistrant tout ou partie des données accessibles sur un serveur informatique ou sur un terminal informatique, tel un ordinateur. Cette étape 32 de collecte peut également être automatique et réalisée par connexion d’un serveur informatique ou ordinateur de collecte à une base de données ouverte. Alternativement, des données statistiques nationales peuvent être saisies par un opérateur humain, via une interface homme-machine, sur un serveur informatique ou ordinateur de collecte.Step 32 of collecting and indexing sets of national statistics is carried out, for example, by a human operator consulting an open database of national statistical data and recording all or part of the data accessible on a computer server or on a computer terminal, such as a computer. This collection step 32 can also be automatic and carried out by connecting a computer server or collection computer to an open database. Alternatively, national statistical data can be entered by a human operator, via a man-machine interface, on a computer server or collection computer.
Chaque donnée statistique nationale ainsi collectée comporte, a minima, un ensemble de mots-clés associé à une valeur chiffrée. Par exemple, une donnée statistique nationale collectée est : « nombre de stéthoscopes vendus en Europe » associé au nombre 175 372.Each national statistical data thus collected includes, at the very least, a set of keywords associated with a numerical value. For example, a national statistical data collected is: "number of stethoscopes sold in Europe" associated with the number 175,372.
L’étape 14 de comparaison est réalisée, par exemple, par la mise en œuvre informatique d’un algorithme de mesure de proximité lexicale et/ou sémantique entre deux ensembles de mots-clés. Un tel algorithme est, par exemple, un algorithme de mesure d’une distance :
- de Hamming,
- de Levenshtein,
- de Damerau-Levenshtein, la distance d'édition et la distance d'édition avec transposition et/ou
- distance de Jaro-Winkler.The comparison step 14 is carried out, for example, by the computer implementation of an algorithm for measuring lexical and/or semantic proximity between two sets of keywords. Such an algorithm is, for example, an algorithm for measuring a distance:
- from Hamming,
- from Levenshtein,
- from Damerau-Levenshtein, the edit distance and the edit distance with transposition and/or
- Jaro-Winkler distance.
Ces exemples de distances sont bien connus de l’art antérieur et du domaine de la fouille de texte, visent à évaluer la distance qui sépare deux chaînes de texte, tels les mots-clés de classe ou de données statistiques nationales par exemple.These examples of distances are well known from the prior art and from the field of text mining, aim to evaluate the distance between two text strings, such as class keywords or national statistical data for example.
Cette mesure de distance, ou d’indice de similarité à l’inverse, a lieu pour au moins une paire formée d’un ensemble, ou sous-ensemble, de mots-clés d’une classe et d’un ensemble, ou sous-ensemble, de mots-clés d’une donnée statistique nationale.This measurement of distance, or of similarity index on the contrary, takes place for at least one pair formed of a set, or subset, of keywords of a class and of a set, or under - set of keywords of national statistical data.
Les classes et jeux de statistiques nationales peuvent appartenir à une arborescence, dite classification, composée de nœuds et de branches. Deux telles arborescences sont illustrées en figure 5 :
- une classification 505 technique d’une part,
- une classification 510 de données statistiques nationales d’autre part.Classes and sets of national statistics can belong to a tree structure, called classification, made up of nodes and branches. Two such trees are illustrated in Figure 5:
- a technical 505 classification on the one hand,
- a classification 510 of national statistical data on the other hand.
La classification 505 technique est formée de deux niveaux de nœuds, 540 et 515, le nœud 540 encapsulant thématiquement le nœud 515. Par exemple, le nœud 540 correspond aux techniques de l’agriculture, et le nœud 515 à la culture de fruits.The 505 technical classification is made up of two levels of nodes, 540 and 515, with node 540 thematically encapsulating node 515. For example, node 540 corresponds to agricultural techniques, and node 515 to fruit growing.
Deux classes 520 terminales sont également représentées et rattachées au nœud 515. Ces classes correspondent aux terminaisons de l’arborescence et sont, par exemple, « techniques de culture en verger » et « techniques de culture sous serre ». On appelle, dans ce document, « classe » à la fois un nœud et une terminaison de la classification.Two terminal 520 classes are also represented and attached to node 515. These classes correspond to the endings of the tree structure and are, for example, “orchard cultivation techniques” and “greenhouse cultivation techniques”. We call, in this document, “class” both a node and an end of the classification.
La classification 510 de données statistiques nationales est formée de deux niveaux de nœuds, 525 et 530, le nœud 525 encapsulant thématiquement le nœud 530. Par exemple, le nœud 525 correspond aux valeurs de production agricoles des fruits et légumes, et le nœud 530 à la valeur de production agricoles des fruits.Classification 510 of national statistical data is formed of two levels of nodes, 525 and 530, node 525 thematically encapsulating node 530. For example, node 525 corresponds to the agricultural production values of fruits and vegetables, and node 530 to the agricultural production value of fruits.
Deux classes 535 terminales sont également représentées et rattachées au nœud 530. Ces classes correspondent aux terminaisons de l’arborescence et sont, par exemple, « fruits produits sous serre » et « autres productions de fruits ». On appelle, dans ce document, « donnée statistique nationale » à la fois un nœud et une terminaison d’une telle classification de données statistiques nationales.Two terminal 535 classes are also represented and attached to node 530. These classes correspond to the endings of the tree structure and are, for example, "fruit produced under greenhouse" and "other fruit production". In this document, “national statistical data” refers to both a node and an end of such a classification of national statistical data.
Lorsqu’au moins une des données parmi des classes ou des données statistiques nationales sont classifiées selon une arborescence déterminée, l’étape de comparaison 13 peut être modifiée ainsi : la similarité est mesurée entre paires de classes – données statistiques nationales est réalisée à différents niveaux d’au moins une arborescence de sorte à hiérarchiser les données statistiques nationales en fonction du niveau pour lequel l’indice de similarité est maximal.When at least one of the data among classes or national statistical data is classified according to a determined tree structure, the comparison step 13 can be modified as follows: the similarity is measured between pairs of classes – national statistical data is carried out at different levels of at least one tree structure so as to prioritize the national statistical data according to the level for which the similarity index is maximum.
Ainsi, préférentiellement, cet indice est mesuré en partant soit du niveau le plus haut, soit le plus bas d’une classification et en allant vers l’autre extrémité.Thus, preferably, this index is measured starting either from the highest or the lowest level of a classification and going to the other end.
Dans l’exemple de la figure 5, par exemple, un indice de similarité est d’abord mesuré entre le nœud 540 et le nœud 525, puis entre le nœud 540 et le nœud 530, puis entre le nœud 540 et chaque donnée 535 terminale. Le même cycle recommence avec les enfants du nœud 540, et ainsi de suite, de sorte à produire une matrice d’indices de similarité.In the example of Figure 5, for example, a similarity index is first measured between node 540 and node 525, then between node 540 and node 530, then between node 540 and each terminal data 535 . The same cycle begins again with the children of node 540, and so on, so as to produce a matrix of similarity indices.
Cette matrice permet d’identifier, pour une classe donnée, la donnée statistique nationale la plus pertinente, quel que soit le niveau dans l’arborescence de cette donnée statistique nationale. Préférentiellement, lors des calculs associés à un nœud, on inclut tout ou partie des mots-clés des enfants dudit nœud aux mots-clés du nœud.This matrix makes it possible to identify, for a given class, the most relevant national statistical data, whatever the level in the tree structure of this national statistical data. Preferably, during the calculations associated with a node, all or part of the keywords of the children of said node are included in the keywords of the node.
Dans l’exemple de la figure 5, pour la classe « techniques de culture sous serre », la donnée statistique nationale la plus similaire est « fruits produits sous serre ». Pour la classe « techniques de culture en verger », la donnée statistique nationale la plus similaire est, dans cet exemple, « valeurs de production agricoles de fruits ».In the example of Figure 5, for the class “greenhouse cultivation techniques”, the most similar national statistical data is “fruit produced under greenhouse”. For the class “orchard cultivation techniques”, the most similar national statistical data is, in this example, “agricultural production values of fruit”.
Préférentiellement, plus une donnée statistique nationale associée à une classe est basse dans l’arborescence économique, plus son indice de similarité est augmenté.Preferably, the lower a national statistical data associated with a class is in the economic tree structure, the more its similarity index is increased.
Dans des variantes, au cours d’une étape de sélection, un utilisateur peut requérir, via une interface homme-machine, de remonter à un niveau de classification technique supérieur ou de descendre à un niveau de classification technique inférieur, dans ce cas, les données statistiques nationales sont adaptées pour correspondre au niveau de classification visé par l’utilisateur.In variants, during a selection step, a user can request, via a man-machine interface, to go up to a higher technical classification level or to go down to a lower technical classification level, in this case, the national statistical data are adapted to correspond to the level of classification intended by the user.
Lorsqu’aucun indice de similarité n’a été calculé pour une paire donnée, l’indice de similarité est déterminé comme minimal, par exemple.When no similarity index has been calculated for a given pair, the similarity index is determined as minimum, for example.
Le procédé 10 comporte une étape d’affectation d’un poids à chaque information représentative du jeu de statistiques nationales collectée en fonction du résultat de la comparaison. Le poids affecté est représentatif d’au moins un élément, ou une combinaison parmi :
- la mesure de similarité effectuée le cas échéant,
- le nombre de mots-clés commun aux deux ensembles,
- le niveau de classification,
- la complétude du jeu de statistiques nationales,
- la provenance des données statistiques nationales,
- un facteur de pertinence ou de non-pertinence donné par l’utilisateur au moyen d’une interface homme machine.The method 10 comprises a step of assigning a weight to each item of information representative of the set of national statistics collected as a function of the result of the comparison. The assigned weight is representative of at least one element, or a combination among:
- the similarity measurement carried out if necessary,
- the number of keywords common to both sets,
- the classification level,
- the completeness of the set of national statistics,
- the origin of the national statistical data,
- a relevance or non-relevance factor given by the user by means of a man-machine interface.
Dans des modes de réalisation particuliers, tel que celui représenté en figure 1, le procédé 10 l’étape de pondération d’un jeu de statistiques nationales est réalisée au moins partiellement en fonction d’une donnée représentative d’une nationalité d’un déposant du brevet. Cette donnée représentative peut être lue, par exemple, sur une base de données en ligne, tel un registre de brevets par exemple.In particular embodiments, such as that represented in FIG. 1, the method 10 the step of weighting a set of national statistics is carried out at least partially as a function of data representative of a nationality of an applicant of the patent. This representative datum can be read, for example, from an online database, such as a patent register for example.
Une étape de hiérarchisation 16 du jeu de statistiques nationales en fonction du poids de chaque dite information. L’étape 16 de hiérarchisation est réalisée, par exemple, par tri des statistiques nationales en relation avec une classe donnée en fonction croissante, ou décroissante du poids affecté. Ce tri est réalisé, par exemple, par un programme informatique. Cette étape 16 de hiérarchisation vise à faciliter la sélection par un utilisateur humain ou par un processus de sélection automatique réalisé, par exemple, par une intelligence artificielle.A step 16 for prioritizing the set of national statistics according to the weight of each said piece of information. Ranking step 16 is carried out, for example, by sorting the national statistics in relation to a given class as an ascending or descending function of the assigned weight. This sorting is carried out, for example, by a computer program. This hierarchization step 16 aims to facilitate the selection by a human user or by an automatic selection process carried out, for example, by an artificial intelligence.
Dans des modes de réalisation particuliers, tel que celui représenté en figure 1, l’étape de hiérarchisation 16 de jeux de statistiques nationales est réalisée, lorsqu’au moins deux classes sont lues, en fonction d’au moins une classe associée à au moins une donnée statistique nationale.In particular embodiments, such as that represented in FIG. 1, the step 16 of hierarchizing sets of national statistics is carried out, when at least two classes are read, according to at least one class associated with at least national statistical data.
Dans des variantes, le serveur informatique associe à au moins une classe un indicateur représentatif d’un caractère applicatif ou technologique, la hiérarchisation 16 étant réalisée de sorte que les données statistiques nationales associées à une classe applicative soient placées plus haut hiérarchiquement.In variants, the computer server associates with at least one class an indicator representative of an application or technological character, the hierarchy 16 being carried out so that the national statistical data associated with an application class are placed higher hierarchically.
Le procédé 10 comporte une étape de sélection 17 d’au moins un jeu de statistiques nationales parmi les jeux de statistiques nationales hiérarchisées.The method 10 comprises a step 17 of selecting at least one set of national statistics from among the sets of hierarchical national statistics.
L’étape 17 de sélection est réalisée, par exemple, par un opérateur humain sélectionnant, via une interface homme-machine et sur un terminal informatique, au moins une donnée statistique nationale à associer avec au moins une classe. Alternativement, cette étape 17 de sélection est réalisée de manière automatique dès qu’une paire présente un poids supérieur à une valeur limite prédéterminée ou déterminée et apprise par une intelligence artificielle. Un tel apprentissage est décrit au regard d’une étape d’apprentissage optionnelle décrite ci-dessous.The selection step 17 is carried out, for example, by a human operator selecting, via a man-machine interface and on a computer terminal, at least one national statistical datum to be associated with at least one class. Alternatively, this selection step 17 is carried out automatically as soon as a pair has a weight greater than a predetermined or determined limit value and learned by an artificial intelligence. Such learning is described with respect to an optional learning step described below.
Dans des modes de réalisation, le procédé 10 comporte une étape d’enregistrement, mise en œuvre, par exemple, par un serveur informatique connecté au terminal utilisé par l’opérateur humain pour enregistrer chaque sélection faite par l’opérateur de sorte à constituer graduellement une base de données de liens entre classes et données statistiques nationales. Cet enregistrement vise à faciliter la sélection réalisée au cours d’une deuxième étape de sélection.In some embodiments, the method 10 comprises a recording step, implemented, for example, by a computer server connected to the terminal used by the human operator to record each selection made by the operator so as to gradually constitute a database of links between classes and national statistical data. This registration is intended to facilitate the selection made during a second selection stage.
Dans des modes de réalisation, une étape de connexion est réalisée, par exemple, par la mise en œuvre d’un réseau de données, tel Internet ou un réseau cellulaire par exemple, entre le deuxième terminal informatique et le serveur informatique enregistrant les associations entre classes et données statistiques nationales.In some embodiments, a connection step is carried out, for example, by implementing a data network, such as the Internet or a cellular network for example, between the second computer terminal and the computer server recording the associations between classes and national statistical data.
La deuxième étape de sélection est réalisée, par exemple, par un opérateur humain sélectionnant, via une interface homme-machine et sur un terminal informatique, au moins une association parmi les associations enregistrées. Alternativement, cette étape de sélection est réalisée de manière automatique en fonction d’un comportement de l’utilisateur appris par une intelligence artificielle. Un tel apprentissage est décrit au regard d’une étape d’apprentissage optionnelle décrite ci-dessous.The second selection step is carried out, for example, by a human operator selecting, via a man-machine interface and on a computer terminal, at least one association from among the registered associations. Alternatively, this selection step is performed automatically based on user behavior learned by artificial intelligence. Such learning is described with respect to an optional learning step described below.
À l’issue de ce procédé 10, un brevet a été associé une jeu de statistiques nationales, une telle association étant fournie, par exemple, affichée ou utilisée dans un processus ultérieur.At the end of this process 10, a patent has been associated with a set of national statistics, such an association being provided, for example, displayed or used in a subsequent process.
Dans des modes de réalisation particuliers, le procédé 10 comporte une étape d’inscription d’au moins une association sélectionnée au cours de la deuxième étape de sélection sur un serveur informatique.In particular embodiments, the method 10 includes a step of registering at least one association selected during the second selection step on a computer server.
Cette étape d’inscription est réalisée, par exemple, de manière similaire à l’étape d’enregistrement, via la connexion du serveur informatique au deuxième terminal. Préférentiellement, cette association est inscrite dans un profil d’utilisateur de l’utilisateur ayant réalisé la deuxième étape de sélection.This registration step is carried out, for example, in a manner similar to the registration step, via the connection of the computer server to the second terminal. Preferably, this association is registered in a user profile of the user who carried out the second selection step.
Dans ces variantes, l'étape d’affectation d’un poids peut être adaptée en fonction d’un contexte de l’utilisateur, ou d’un indicateur de pertinence ou non, et de réduire le champ des associations applicables à l’utilisateur. Ainsi, les associations enregistrées au cours de l’étape d’affectation d’un poids 17 peuvent être contextuellement neutres tandis que les associations inscrites au cours de l’étape d’inscription tiennent comptent du contexte propre à l’utilisateur.In these variants, the step of assigning a weight can be adapted according to a context of the user, or an indicator of relevance or not, and to reduce the field of associations applicable to the user . Thus, the associations recorded during the step of assigning a weight 17 can be contextually neutral while the associations recorded during the registration step take into account the context specific to the user.
Par exemple, une donnée statistique nationale peut associer une classe technique de « moyens de commandes électroniques » à la fois à une donnée statistique nationale de « commandes automatiques de portes » et de « commandes automatiques de vannes de gaz ». Ces deux associations peuvent avoir été sélectionnées au cours de la première étape 17 de sélection car visant bien des moyens de commandes électriques. Au cours de la deuxième étape de sélection, l’utilisateur, gestionnaire d’un portefeuille de brevets dans le domaine du gaz, sélectionne uniquement les commandes automatiques de vannes de gaz de sorte à visualiser des données statistiques nationales pour son utilisation des brevets, modifiant ainsi le poids affecté aux jeux de statistiques nationales.For example, national statistical data can associate a technical class of “electronic control means” with both national statistical data of “automatic door controls” and “automatic gas valve controls”. These two associations may have been selected during the first step 17 of selection since they target many electrical control means. During the second stage of selection, the user, manager of a portfolio of patents in the field of gas, selects only the automatic controls of gas valves so as to visualize national statistical data for his use of the patents, modifying thus the weight assigned to the sets of national statistics.
Dans des modes de réalisation, au moins une étape de sélection 17 est réalisée par un algorithme d’apprentissage automatique.In some embodiments, at least one selection step 17 is carried out by an automatic learning algorithm.
Dans des modes de réalisation particuliers, tel que celui représenté en figure 1, le procédé 10 comporte en aval de l’étape d’inscription, une étape 150 d’apprentissage d’un comportement de sélection au cours de la deuxième étape de sélection, l’algorithme d’apprentissage automatique sélectionnant une association en fonction d’au moins un comportement appris.In particular embodiments, such as that represented in FIG. 1, the method 10 comprises, downstream of the registration step, a step 150 of learning a selection behavior during the second selection step, the machine learning algorithm selecting an association based on at least one learned behavior.
L’étape 150 d’apprentissage est réalisée, par exemple, de manière probabiliste par lecture successive des sélections réalisées par un utilisateur pour déterminer un comportement de l’utilisateur en regard des premiers et deuxièmes ensembles de mots-clés. La description qui suit considère qu’un premier ensemble est défini par l’intitulé d’une classe et qu’un deuxième ensemble est défini par l’intitulé d’un jeu de statistiques nationales. Lorsqu’une fréquence d’association classe – jeu de statistique nationale est inférieure à une fréquence limite déterminée, l’association classe – jeu de statistiques nationales est soit retirée pour cet utilisateur, soit prédésélectionnée. Lorsqu’une fréquence d’association est basse pour un nombre déterminé d’utilisateurs distincts, le poids affecté entre la classe et le jeu de statistiques nationales peut être réduit de sorte qu’au cours de l’étape de sélection, cette association soit hiérarchisée à un niveau plus bas ou que, si la sélection est automatisée, cette association soit effacée.The learning step 150 is carried out, for example, in a probabilistic manner by successive reading of the selections made by a user to determine a behavior of the user with regard to the first and second sets of keywords. The following description considers that a first set is defined by the title of a class and that a second set is defined by the title of a set of national statistics. When a class – national statistics set association frequency is lower than a determined limit frequency, the class – national statistics set association is either withdrawn for this user, or pre-selected. When an association frequency is low for a determined number of distinct users, the weight assigned between the class and the set of national statistics can be reduced so that during the selection step, this association is prioritized at a lower level or, if the selection is automated, this association is erased.
Dans des modèles d’apprentissage plus approfondis, l’algorithme d’apprentissage automatique est conçu pour détecter, dans un ensemble de mots-clés non sélectionnés par un utilisateur en regard d’un jeu de statistiques nationales, la composition de cet ensemble de sorte à établir une règle en fonction des comportements successifs de l’utilisateur.In deeper learning models, the machine learning algorithm is designed to detect, in a set of keywords not selected by a user against a set of national statistics, the composition of this set so to establish a rule according to the successive behaviors of the user.
L’étape 18 de fourniture est réalisée, par exemple, par la mise en œuvre d’un affichage sur un écran du deuxième terminal.The supply step 18 is carried out, for example, by implementing a display on a screen of the second terminal.
On décrit, ci-après des étapes particulières et des modes de réalisation particuliers de l’étape de construction de la deuxième base de données.Specific steps and specific embodiments of the step for constructing the second database are described below.
Dans des modes de réalisation, le procédé objet de la présente invention comporte, en aval de l’étape de collecte 32, une étape de normalisation d’au moins une partie des données collectées.In some embodiments, the method that is the subject of the present invention comprises, downstream of the collection step 32, a step of normalizing at least part of the collected data.
Le problème à résoudre est le suivant : un ensemble de données collecté peut comporter des données classées selon plusieurs approches systématiques distinctes (de type taxonomie par exemple), rendant les données incohérentes. Dans un tel ensemble, chaque donnée comporte à la fois une valeur et un indicateur de système de classification utilisé. Toutefois, il résulte de la pluralité d’approches systématiques utilisées une incohérence entre les données représentatives, pourtant, d’un même objet ou concept.The problem to be solved is the following: a collected data set can include data classified according to several distinct systematic approaches (taxonomy type for example), making the data inconsistent. In such a set, each datum includes both a value and an indicator of the classification system used. However, it results from the plurality of systematic approaches used an inconsistency between the representative data, however, of the same object or concept.
Une illustration de cet exemple est, par exemple, la classification d’une valeur monétaire de production de chaussures évoluant d’une année à l’autre. Dans cette illustration, cette valeur monétaire peut être positionnée dans une classe nommée « A » d’un premier système pour une année déterminée et dans une classe nommée « B » d’un deuxième système pour une autre année. Or, pour la première année déterminée, la classe « B » correspond dans le premier système utilisé à la valeur monétaire de production de savon, résultant en une incohérence des données collectées.An illustration of this example is, for example, the classification of a monetary value of shoe production changing from one year to the next. In this illustration, this monetary value can be positioned in a class named “A” of a first system for a given year and in a class named “B” of a second system for another year. However, for the first year determined, class “B” corresponds in the first system used to the monetary value of soap production, resulting in an inconsistency in the data collected.
Cette illustration peut être schématisée ainsi, pour une donnée représentative d’un objet et/ou concept unique :This illustration can be schematized as follows, for data representative of a single object and/or concept:
Ainsi, au cours de l’étape de normalisation, un ensemble de données collectées est traduit selon une approche systématique unifiée. Cette étape de normalisation est réalisée, par exemple, par un dispositif électronique de calcul configuré pour attribuer une valeur à chaque entrée d’une base de données comportant l’ensemble de données, ladite valeur étant associée à un indicateur de système de classification utilisé unique.Thus, during the normalization step, a set of collected data is translated according to a unified systematic approach. This normalization step is carried out, for example, by an electronic calculation device configured to assign a value to each entry of a database comprising the set of data, said value being associated with a unique classification system indicator used .
Le système de classification utilisé peut être déterminé par un utilisateur, via une interface homme-machine. L’utilisateur choisit, par exemple, un système de classification parmi une liste de tous les systèmes de classification dont un indicateur est détecté parmi les données de l’ensemble de données.The classification system used can be determined by a user, via a man-machine interface. The user chooses, for example, a classification system from a list of all classification systems for which an indicator is detected among the data in the dataset.
Le système de classification utilisé peut être déterminé automatiquement, par exemple, par le dispositif électronique de calcul configuré pour déterminer de manière statistique un nombre de données associées à chaque système de classification et pour sélectionner le système de classification dont le nombre d’occurrences est le plus élevé. Alternativement, cette approche statistique peut être réalisée sur un échantillon de données correspondant à des états de l’objet et/ou concept compris entre deux dates déterminées, par exemple deux ans en amont de la date d’exécution de l’étape d’harmonisation.The classification system used can be determined automatically, for example, by the electronic calculation device configured to statistically determine a number of data associated with each classification system and to select the classification system whose number of occurrences is the higher. Alternatively, this statistical approach can be carried out on a sample of data corresponding to states of the object and/or concept between two determined dates, for example two years before the date of execution of the harmonization step .
Alternativement, le dispositif électronique de calcul est configuré pour déterminer de manière statistique un nombre de données associées à chaque système de classification pour des données correspondent au dernier état de l’objet et/ou concept que ces données représentent et pour sélectionner le système de classification dont le nombre d’occurrences est le plus élevé.Alternatively, the electronic calculation device is configured to statistically determine a number of data associated with each classification system for data corresponding to the last state of the object and/or concept that this data represents and to select the classification system with the highest number of occurrences.
Une fois le système de classification utilisé déterminé, l’étape de normalisation met en œuvre, préférentiellement, une table de correspondance entre systèmes de classification pour remplacer les indicateurs de système de classification non utilisés par les indicateurs du système de classification. Par exemple, dans le tableau ci-dessous, les entrées correspondant aux lignes « classe 2010 – A » et « système de classification 2010 – 1 » sont remplacées ou complétées par des lignes « classe 2010 – B » et « système de classification 2010 – 2 ».Once the classification system used has been determined, the standardization step preferably implements a correspondence table between classification systems to replace the classification system indicators not used by the classification system indicators. For example, in the table below, the entries corresponding to the lines “class 2010 – A” and “classification system 2010 – 1” are replaced or supplemented by lines “class 2010 – B” and “classification system 2010 – 2”.
La table de correspondance peut être prédéterminée, collectée ou dynamique et obtenue par l’utilisation d’un algorithme d’apprentissage automatique configuré pour déterminer une proximité sémantique entre objets d’au moins deux systèmes de classification différents et, en fonction d’une valeur de cette proximité sémantique, déterminer une correspondance entre les classes correspondantes auxdits objets dans les systèmes de classification.The correspondence table can be predetermined, collected or dynamic and obtained by the use of an automatic learning algorithm configured to determine a semantic proximity between objects of at least two different classification systems and, according to a value from this semantic proximity, determining a correspondence between the classes corresponding to said objects in the classification systems.
Par exemple, dans le tableau ci-dessus, les valeurs de 2010 et 2011 sont toutes deux représentatives, quel que soit le système de classification, de la valeur de production de chaussures. La proximité entre ces deux labels est totale puisque ces labels sont identiques : une correspondance peut ainsi être automatiquement générée entre les classes A, du système de classification 2010 et B du système de classification 2011.For example, in the table above, the values for 2010 and 2011 are both representative, regardless of the classification system, of the production value of footwear. The proximity between these two labels is total since these labels are identical: a correspondence can thus be automatically generated between classes A, of the 2010 classification system and B of the 2011 classification system.
Dans des variantes, lorsque cette table de correspondance associe plusieurs classes dans un système non-utilisé à une classe dans le système utilisé, les valeurs associées à ces classes sont additionnées pour produire une valeur composite. Par exemple, si une valeur en 2010 pour la classe « A » est de 10 et la valeur en 2010 pour une classe « B » est de 20 et que la table de correspondance fait correspondre « A » à la classe « C » et « B » à la classe « C », la valeur en classe « C » pour 2010 et dans le système de classification de « C » est de 30.In variants, when this correspondence table associates several classes in a non-used system with a class in the system used, the values associated with these classes are added to produce a composite value. For example, if a value in 2010 for class "A" is 10 and the value in 2010 for a class "B" is 20 and the lookup table maps "A" to class "C" and " B” to class “C”, the value in class “C” for 2010 and in the classification system of “C” is 30.
Parfois, une telle approche est impossible, notamment lorsqu’une classe d’un système de classification antérieur au système de classification utilisé est scindée en deux. Il est, dans ces cas-là, impossible de savoir quelle part d’une valeur associée à une classe du système de classification antérieure est à affecter à chacune des deux nouvelles classes dans le système de classification utilisé. Dans de tels cas, le dispositif électronique de calcul attribue soit une valeur de 0 dans le système de classification utilisé, soit une valeur déterminée en fonction d’une proportion déterminée entre les deux classes du système de classification utilisé.Sometimes such an approach is not possible, especially when a class from a classification system that predates the classification system in use is split into two. In these cases, it is impossible to know what part of a value associated with a class of the previous classification system is to be assigned to each of the two new classes in the classification system used. In such cases, the electronic calculation device assigns either a value of 0 in the classification system used, or a value determined according to a determined proportion between the two classes of the classification system used.
Dans ces variantes, le procédé objet de la présente invention comporte une étape d’extrapolation 34 d’une statistique nationale d’un jeu de statistiques nationales présentant une statistique nationale manquante, chaque valeur obtenue par extrapolation étant associée au deuxième ensemble de mots-clés de l’information représentative du jeu de statistiques nationales de la valeur extrapolée. Cette étape 34 d’extrapolation est réalisée, par exemple, par le dispositif électronique de calcul calculant une moyenne de la proportion relative de valeurs connues pour des classes du système de classification utilisé formant, de manière combinée, une classe du système de classification antérieur pour un autre jeu de données connu. Par exemple, voici un tableau de données :In these variants, the method that is the subject of the present invention comprises a step 34 of extrapolating a national statistic from a set of national statistics presenting a missing national statistic, each value obtained by extrapolation being associated with the second set of keywords information representative of the set of national statistics of the extrapolated value. This extrapolation step 34 is carried out, for example, by the electronic calculation device calculating an average of the relative proportion of known values for classes of the classification system used forming, in a combined manner, a class of the previous classification system for another known dataset. For example, here is a data table:
Dans cet exemple, la valeur associée à la classe « A » dans le système de classification 2010 correspond en partie à la valeur associée à la classe « B » et en partie à la valeur associée à la classe « C » du système de classification 2011. La valeur associée aux classes « B » et « C » dans le système de classification 2011 représentent respectivement 75% et 25% du total de ces deux valeurs.In this example, the value associated with class "A" in the 2010 classification system corresponds partly to the value associated with class "B" and partly to the value associated with class "C" of the 2011 classification system The value associated with classes “B” and “C” in the 2011 classification system represent respectively 75% and 25% of the total of these two values.
Ainsi, la valeur associée à la classe « A » dans le système de classification 2010 peut recevoir en valeur correspondante dans les classes « B » et « C » du système de classification 2011 respectivement les valeurs « 1500 » et « 500 ».Thus, the value associated with class “A” in the 2010 classification system can receive corresponding values in classes “B” and “C” of the 2011 classification system respectively the values “1500” and “500”.
Dans des modes de réalisation, le procédé objet de la présente invention comporte une étape de calcul d’une valeur agrégée en fonction de valeurs collectées au cours de l’étape 32 de collecte, harmonisées au cours de l’étape d’harmonisation et/ou extrapolées au cours de l’étape 34 d’extrapolation. Une telle valeur agrégée correspond, par exemple, à une valeur d’un indicateur économique pour un office de brevet, cette valeur d’indicateur économique étant obtenue par addition des valeurs de l’indicateur économique pour les pays membres de cet office de brevets.In some embodiments, the method that is the subject of the present invention comprises a step of calculating an aggregated value as a function of values collected during the collection step 32, harmonized during the harmonization step and/or or extrapolated during step 34 of extrapolation. Such an aggregated value corresponds, for example, to a value of an economic indicator for a patent office, this economic indicator value being obtained by adding the values of the economic indicator for the member countries of this patent office.
Dans des modes de réalisation, l’étape 34 d’extrapolation consiste à combler, dans une suite de données, des valeurs manquantes.In some embodiments, the extrapolation step 34 consists of filling in missing values in a sequence of data.
Par exemple, si le jeu de données comporte seulement des valeurs pour les années 2010, 2011, 2013 et 2014, quelle valeur considérer pour l’année 2012 ? Cette continuité de la donnée est essentielle pour détecter une tendance dans de nombreux usages.For example, if the dataset only has values for the years 2010, 2011, 2013 and 2014, which value should be considered for the year 2012? This continuity of data is essential to detect a trend in many uses.
Plusieurs méthodes d’extrapolation peuvent être employées ici. Dans une première variante, une interpolation linéaire est employée pour déterminer une fonction mathématique qui comporte deux points entourant une donnée manquante et en calculant, à partir de cette fonction, la valeur pour le point manquant. Par exemple, si la valeur associée à 2011 est « 10 » et la valeur associée à 2013 est « 30 », la valeur 2012 peut être estimée à « 20 », soit la moyenne de « 10 » et de « 30 ».Several extrapolation methods can be used here. In a first variant, a linear interpolation is used to determine a mathematical function which comprises two points surrounding a missing datum and by calculating, from this function, the value for the missing point. For example, if the value associated with 2011 is "10" and the value associated with 2013 is "30", the value for 2012 can be estimated as "20", which is the average of "10" and "30".
Une telle méthode, toutefois est limitée aux cas où une valeur postérieure à la valeur recherchée est connue et, de plus, perd grandement en précision lorsqu’il manque plusieurs valeurs successives. Enfin, une telle méthode empêche la valeur ainsi calculée de sortir de l’intervalle compris entre la valeur minimale et la valeur maximale des valeurs entourant la valeur à estimer.Such a method, however, is limited to cases where a value after the desired value is known and, moreover, loses a great deal of precision when several successive values are missing. Finally, such a method prevents the value thus calculated from leaving the interval between the minimum value and the maximum value of the values surrounding the value to be estimated.
Pour pallier ces inconvénients, une méthode alternative d’extrapolation employée peut consister en une extrapolation de tendance.To overcome these drawbacks, an alternative extrapolation method used may consist of trend extrapolation.
Dans des modes de réalisation, les jeux de statistiques nationales sont organisés dans au moins une arborescence comportant au moins deux niveaux, un niveau dit « supérieur » auquel est rattaché un niveau dit « inférieur » comportant plusieurs jeux de statistiques nationales, le jeu de statistique nationale du niveau supérieur étant égal à la somme des jeux de valeurs du niveau inférieur. Dans ces modes de réalisation, une fonction d’ajustement de courbe peut être employée sur un ensemble de valeurs antérieures à une valeur à combler. Une fois cette courbe obtenue, le calcul de la valeur manquante peut être réalisé en fonction d’une des coordonnées de cette valeur, comme une année par exemple.In some embodiments, the sets of national statistics are organized in at least one tree structure comprising at least two levels, a so-called "upper" level to which is attached a so-called "lower" level comprising several sets of national statistics, the set of statistics value of the higher level being equal to the sum of the sets of values of the lower level. In these embodiments, a curve fitting function may be employed on a set of values prior to a value to be filled. Once this curve has been obtained, the calculation of the missing value can be carried out according to one of the coordinates of this value, such as a year for example.
Toutefois, une telle méthode peut engendrer des courbes présentant localement des taux de croissance trop importants pour être cohérents avec des valeurs réelles mesurées a posteriori.However, such a method can generate curves locally presenting growth rates that are too high to be consistent with real values measured a posteriori.
Pour éviter un tel inconvénient, une valeur à combler peut être déterminée par pondération des résultats de différentes méthodes d’extrapolation, telles par exemple les méthodes d’interpolation linéaire et d’ajustement de courbe.To avoid such an inconvenience, a value to be filled can be determined by weighting the results of different extrapolation methods, such as linear interpolation and curve fitting methods.
Dans des modes de réalisation, dans lequel les jeux de statistiques nationales sont organisés dans au moins une arborescence comportant au moins deux niveaux, un niveau dit « supérieur » auquel est rattaché un niveau dit « inférieur » comportant plusieurs jeux de statistiques nationales, le jeu de statistique nationale du niveau supérieur étant égal à la somme des jeux de valeurs du niveau inférieur.In embodiments, in which the sets of national statistics are organized in at least one tree structure comprising at least two levels, a so-called "upper" level to which is attached a so-called "lower" level comprising several sets of national statistics, the set of national statistics of the higher level being equal to the sum of the sets of values of the lower level.
Dans des modes de réalisation, les jeux de statistiques nationales sont organisés selon deux arborescences distinctes, une statistique nationale d’une arborescence étant extrapolée en fonction d’un jeu de statistiques nationales d’une autre arborescence. Dans ces modes de réalisation, des méthodes d’extrapolation consistent en l’application d’une tendance issue d’un autre jeu de valeurs au jeu de valeurs pour lequel une valeur doit être comblée, lors d’une étape de comparaison d’arborescences. Cet autre jeu de valeurs peut être issu d’une étape 32 de collecte d’un jeu de statistiques nationales distinctes.In embodiments, the sets of national statistics are organized according to two distinct trees, a national statistic of one tree being extrapolated according to a set of national statistics of another tree. In these embodiments, extrapolation methods consist of applying a trend from another set of values to the set of values for which a value must be filled, during a tree comparison step . This other set of values can come from a step 32 of collecting a set of distinct national statistics.
Ces méthodes consistent à déterminer un taux de variation d’une valeur à partir d’un taux de variation mesurée pour d’autres valeurs connues d’un autre jeu de valeurs.These methods consist in determining a rate of variation of a value from a rate of variation measured for other known values of another set of values.
Par exemple de manière très simplifiée, si entre les années 2010 et 2011, le taux de croissance du Produit Intérieur Brut est de 5%, une valeur de production de chaussures en 2011, à combler, peut être calculée par l’utilisation de la formule « valeur de production de chaussures en 2010 x 105% ».For example, in a very simplified way, if between the years 2010 and 2011, the growth rate of the Gross Domestic Product is 5%, a production value of shoes in 2011, to be filled, can be calculated by using the formula “shoe production value in 2010 x 105%”.
Le jeu de valeurs utilisé pour déterminer cette variation peut être prédéterminé ou, préférentiellement, déterminé automatiquement.The set of values used to determine this variation can be predetermined or, preferably, determined automatically.
Dans des variantes où le jeu de valeurs sélectionné est déterminé automatiquement, une étape de détermination est réalisée au cours du procédé objet de la présente invention. Cette étape de détermination est réalisée, par exemple, par un dispositif électronique de calcul.In variants where the selected set of values is determined automatically, a determination step is carried out during the method that is the subject of the present invention. This determination step is carried out, for example, by an electronic calculation device.
Au cours de cette étape de détermination, au moins un jeu de valeurs est sélectionné parmi un ensemble de jeux de valeurs disponibles. Pour chaque tel jeu de valeurs sélectionné, une évaluation de la pertinence du jeu de valeurs est réalisée. Cette évaluation est réalisée, par exemple, par la comparaison entre une variation dans le temps du jeu de valeurs et une variation dans le temps du jeu de valeurs dont une valeur est à combler. Si les signatures des variations correspondent, c’est-à-dire présentent un indice de corrélation supérieur à une valeur déterminée, le jeu de valeurs évalué est validé.During this determination step, at least one set of values is selected from a set of available sets of values. For each such set of values selected, an evaluation of the relevance of the set of values is carried out. This evaluation is carried out, for example, by the comparison between a variation over time of the set of values and a variation over time of the set of values of which a value is to be filled. If the signatures of the variations correspond, i.e. have a correlation index greater than a determined value, the set of values evaluated is validated.
Le taux de variation correspondant à une valeur connue dans le jeu de valeurs connu correspondant à une valeur inconnue du jeu de valeurs à combler est ensuite appliqué au jeu de valeurs à combler pour déterminer la valeur inconnue.The rate of change corresponding to a known value in the known set of values corresponding to an unknown value in the set of values to be filled is then applied to the set of values to be filled to determine the unknown value.
Dans des variantes, des valeurs connues du jeu de valeurs à combler sont virtuellement considérées comme inconnues, de sorte que la fiabilité de prédiction peut être évaluée au cours de l’étape d’évaluation à partir de valeurs réelles.In variants, known values of the set of values to be filled are virtually considered as unknown, so that the prediction reliability can be evaluated during the evaluation step from real values.
Dans des variantes, que l’extrapolation soit réalisée pour combler une valeur manquante dans une suite de valeurs ou pour calculer une valeur en bout de jeu de valeurs, le procédé objet de la présente invention met en œuvre un algorithme d’apprentissage automatique configuré pour à partir d’un ensemble de valeurs connues et d’un nombre déterminé de paramètres associés à ces valeurs, déterminer une pondération entre des valeurs associées à paramètres d’autres jeux de valeurs.In variants, whether the extrapolation is carried out to fill in a missing value in a sequence of values or to calculate a value at the end of a set of values, the method that is the subject of the present invention implements an automatic learning algorithm configured to from a set of known values and a determined number of parameters associated with these values, determining a weighting between values associated with parameters of other sets of values.
Ci-après, un exemple d’étape d’extrapolation est fourni.Below, an example of an extrapolation step is provided.
Dans cet exemple, on considère que les valeurs collectées sont issues de sources distinctes et que ces valeurs sont représentatives de différentes manières de caractériser un pays. À titre d’exemple :
- une première source de données fournit un jeu de valeurs représentatives d’un nombre de naissances, du PIB et d’une production énergétique issues de sources renouvelables pour la France, le Royaume-Uni et l’Allemagne,
- une deuxième source de données fournit un jeu de valeurs représentatives d’une valeur monétaire représentative des imports et exports de couches infantiles recyclables pour la France et le Royaume-Uni et
- une troisième source de données fournit un jeu de valeurs représentatives d’une valeur monétaire représentative de la production de couches infantiles pour la France et l’Allemagne.In this example, we consider that the values collected come from different sources and that these values are representative of different ways of characterizing a country. For exemple :
- a first source of data provides a set of values representative of a number of births, GDP and energy production from renewable sources for France, the United Kingdom and Germany,
- a second source of data provides a set of values representative of a monetary value representative of imports and exports of recyclable infant diapers for France and the United Kingdom and
- a third source of data provides a set of values representative of a monetary value representative of the production of infant diapers for France and Germany.
Chaque jeu de valeurs comporte une valeur pour chacune des années 2010, 2011 et 2012, par exemple. Dans cet exemple, la valeur de production de couches infantiles est inconnue pour le Royaume-Uni, quelle que soit l’année.Each value set has a value for each of the years 2010, 2011, and 2012, for example. In this example, the production value of infant nappies is unknown for the UK in any year.
Pour déterminer les valeurs de production de couches infantiles du Royaume-Uni de 2010, 2011 et 2012, le dispositif électronique calcul évalue l’évolution du PIB de France entre 2010 et 2011 et entre 2011 et 2012 et compare cette évolution avec, respectivement, l’évolution de la valeur monétaire représentative de la production de couches infantiles pour la France entre 2010 et 2011 et entre 2011 et 2012. Si ces évolutions présentent un coefficient de corrélation plus élevé que, par exemple, l’évolution de la production énergétique issue de sources renouvelables de France entre 2010 et 2011 et entre 2011 et 2012 comparée avec, respectivement, l’évolution de la valeur monétaire représentative de la production de couches infantiles pour la France entre 2010 et 2011 et entre 2011 et 2012, alors le dispositif de calcul détermine que l’évolution du PIB est plus représentative que l’évolution de la production énergétique issue de sources renouvelables pour estimer la valeur la valeur de production de couches infantiles. Connaissant le PIB du Royaume-Uni et son évolution dans le temps, le dispositif électronique de calcul détermine une règle de trois applicable en France et en Allemagne entre le PIB et la production de couches infantiles et applique cette règle de trois à la valeur du PIB du Royaume-Uni pour chaque année pour déterminer la valeur de production infantile des années 2010, 2011 et 2012.To determine the production values of infant nappies in the United Kingdom for 2010, 2011 and 2012, the electronic calculation device evaluates the evolution of the GDP of France between 2010 and 2011 and between 2011 and 2012 and compares this evolution with, respectively, the change in the representative monetary value of the production of infant diapers for France between 2010 and 2011 and between 2011 and 2012. If these changes have a higher correlation coefficient than, for example, the change in energy production from renewable sources of France between 2010 and 2011 and between 2011 and 2012 compared with, respectively, the evolution of the representative monetary value of the production of infant diapers for France between 2010 and 2011 and between 2011 and 2012, then the calculation device determines that the evolution of GDP is more representative than the evolution of energy production from renewable sources to estimate the value of the product value ction of infant diapers. Knowing the GDP of the United Kingdom and its evolution over time, the electronic calculation device determines a rule of three applicable in France and Germany between GDP and the production of infant nappies and applies this rule of three to the value of GDP of the United Kingdom for each year to determine the infant production value for the years 2010, 2011 and 2012.
Dans une variante plus perfectionnée, basée sur une technologie d’apprentissage automatique, le dispositif électronique de calcul attribue des facteurs de pondération à chacun des types de données et à des paramètres enregistrés propres à chaque pays à partir de données passées connues de valeurs de production de couches pour le Royaume-Uni.In a more sophisticated variant, based on machine learning technology, the electronic calculating device assigns weighting factors to each of the data types and to recorded parameters specific to each country from known past data of production values nappies for the UK.
On observe, en figure 4, un deuxième mode de réalisation 40 du procédé objet de la présente invention. Le mode réalisation représenté en figure 4 est compatible avec tous les modes réalisation décrits ci-dessus. Les étapes 11 à 18 sont identiques aux modes de réalisations décrits ci-dessus.A second embodiment 40 of the method which is the subject of the present invention is observed in FIG. The embodiment represented in FIG. 4 is compatible with all the embodiments described above. Steps 11 to 18 are identical to the embodiments described above.
Le procédé 40 comporte additionnellement les étapes 41 à 46.Method 40 additionally comprises steps 41 to 46.
Pour l’implémentation du procédé 40, la première base de données comporte pour chaque brevet, une identification d’au moins un titulaire et un code représentatif de la portée géographique.For the implementation of the method 40, the first database comprises for each patent, an identification of at least one holder and a code representing the geographical scope.
Le procédé 40 comporte :
- une étape d’association 41 d’au moins un autre brevet de la première base de données correspondant au premier ensemble de mots-clés de l’identifiant saisi et/ou au titulaire du titre,
- une étape de décompte 42 du nombre d’occurrences de chaque code représentatif de la portée géographique en fonction de chaque autre brevet associé brevet dont l’identifiant est saisi;
- une étape de pondération 43 de chaque statistique nationale du jeu de statistiques nationales sélectionné en fonction du nombre d’occurrences,
- lors de l’étape de fourniture 18, le jeu de statistiques nationales est classé par pondération décroissante.Process 40 includes:
- a step 41 for associating at least one other patent from the first database corresponding to the first set of keywords of the identifier entered and/or to the holder of the title,
- a step 42 of counting the number of occurrences of each code representative of the geographical scope as a function of each other patent associated patent whose identifier is entered;
- a step 43 for weighting each national statistic of the set of national statistics selected according to the number of occurrences,
- During the supply step 18, the set of national statistics is classified by decreasing weighting.
Dans des modes de réalisation, l’étape d’association 41 associe au moins un autre brevet de la première base de données correspondant au premier ensemble de mots-clés de l’identifiant saisi. L’étape d’association 41 est réalisée, par exemple, par la mise en œuvre informatique d’un algorithme de mesure de proximité lexicale entre deux ensembles de mots-clés. Un tel algorithme est, par exemple, un algorithme de mesure d’une distance :
- de Hamming,
- de Levenshtein ?
- de Damerau-Levenshtein, la distance d'édition et la distance d'édition avec transposition et/ou
- distance de Jaro-Winkler.In some embodiments, the association step 41 associates at least one other patent from the first database corresponding to the first set of keywords of the entered identifier. The association step 41 is carried out, for example, by the computer implementation of an algorithm for measuring lexical proximity between two sets of keywords. Such an algorithm is, for example, an algorithm for measuring a distance:
- from Hamming,
- from Levenshtein?
- from Damerau-Levenshtein, the edit distance and the edit distance with transposition and/or
- Jaro-Winkler distance.
Ces exemples de distances sont bien connus de l’art antérieur et du domaine de la fouille de texte, visent à évaluer la distance qui sépare deux chaînes de texte, tels les mots-clés de classe ou de données statistiques nationales par exemple.These examples of distances are well known from the prior art and from the field of text mining, aim to evaluate the distance between two text strings, such as class keywords or national statistical data for example.
Cette mesure de distance, ou d’indice de similarité à l’inverse, a lieu pour au moins une paire formée d’un ensemble, ou sous-ensemble, de mots-clés d’une classe et d’un ensemble, ou sous-ensemble, de mots-clés d’une donnée statistique nationale.This measurement of distance, or of similarity index on the contrary, takes place for at least one pair formed of a set, or subset, of keywords of a class and of a set, or under - set of keywords of national statistical data.
Dans des modes de réalisation, au moins un intitulé d’une classe technique est associé à un ensemble de mots-clés. Par exemple, des mots-clés peuvent être extraits dudit intitulé.In embodiments, at least one title of a technical class is associated with a set of keywords. For example, keywords can be extracted from said title.
Préférentiellement, ces modes de réalisation comportent une étape d’évaluation d’une classe technique prédominante associée à l’identifiant saisi en fonction de chaque classe technique associée à l’identifiant saisi. Chaque classe technique associée à l’identifiant saisi donne une information concernant un domaine technique auquel s’applique le titre de propriété industrielle. L’étape d’évaluation permet de déduire le domaine technique prédominant.Preferably, these embodiments comprise a step of evaluating a predominant technical class associated with the entered identifier according to each technical class associated with the entered identifier. Each technical class associated with the identifier entered gives information concerning a technical field to which the industrial property title applies. The evaluation step makes it possible to deduce the predominant technical domain.
Préférentiellement, l’étape d’évaluation comporte :
- une étape de troncature de chaque classe technique pour obtenir une classe tronquée,
- une étape de décompte du nombre d’occurrences de classes de même troncature, le domaine technique évalué correspondant à la classe tronquée de nombre d’occurrences majoritaire.Preferably, the evaluation step includes:
- a truncation step for each technical class to obtain a truncated class,
a step for counting the number of occurrences of classes of the same truncation, the evaluated technical field corresponding to the truncated class of majority number of occurrences.
Lors de l’étape de troncature, chaque classe est tronquée telle que la sous-classe est le dernier élément pris en compte. Par exemple, la classe « A21C1/06 » est écourtée à « A21C ». L’étape de troncature est effectuée informatiquement, par exemple au moyen d’un serveur applicatif interrogeant la première base de données pour récupérer chaque classe. Dans des modes de réalisation, la classe peut être écourtée aux chiffres représentatifs de la classe. Par exemple, la classe « A21C1/06 » est écourtée à « A21 ». En d’autres termes, lorsque la classification technique des brevets, par exemple la CPC ou la CIB, est vue comme une arborescence, la troncature revient à remonter à un nœud supérieur de l’arborescence.During the truncation step, each class is truncated such that the subclass is the last element considered. For example, the class "A21C1/06" is shortened to "A21C". The truncation step is performed by computer, for example by means of an application server interrogating the first database to retrieve each class. In embodiments, the class may be shortened to the representative digits of the class. For example, the class "A21C1/06" is shortened to "A21". In other words, when the technical classification of patents, for example the CPC or the IPC, is seen as a tree structure, the truncation amounts to going back to a higher node of the tree structure.
Puis, on compte, pour le brevet correspondant à l’identifiant saisi, le nombre de classes qui, une fois tronquées sont identiques. Pour effectuer le décompte informatiquement, on peut utiliser un algorithme de tri connu de l’homme du métier.Then, for the patent corresponding to the entered identifier, we count the number of classes which, once truncated, are identical. To carry out the calculation by computer, it is possible to use a sorting algorithm known to those skilled in the art.
Le premier ensemble de mots-clés est déterminé en fonction de l’intitulé de la classe tronquée apparaissant le plus grand nombre de fois.The first set of keywords is determined based on the title of the truncated class appearing the most times.
Préférentiellement, l’étape d’évaluation, l’étape de troncature et l’étape de décompte sont appliquées à chaque autre brevet de la première base de données et plus particulièrement ceux présentant un titulaire correspondant.Preferably, the evaluation step, the truncation step and the counting step are applied to each other patent in the first database and more particularly those with a corresponding holder.
On appelle titulaire correspondant, des titulaires dont le nom est le même et/ou dont un identifiant national unique, par exemple le numéro du système d’identification du répertoire des entreprises (d’acronyme « SIREN ») est le même. Dans d’autres modes de réalisation, deux titulaires sont considérées comme correspondants si, après application d’un algorithme de calcul d’une proximité sémantique, la proximité sémantique est supérieure à une valeur limite prédéterminée, par exemple égale à 90% de la valeur maximale de proximité sémantique.The term corresponding holder refers to holders whose name is the same and/or whose unique national identifier, for example the number of the business directory identification system (acronym " SIREN ") is the same. In other embodiments, two holders are considered as corresponding if, after application of an algorithm for calculating a semantic proximity, the semantic proximity is greater than a predetermined limit value, for example equal to 90% of the value maximum semantic proximity.
Dans des modes de réalisation, le procédé 40 comporte une étape d’uniformisation des données informatiques représentatives de titulaires stockées dans la première base de données. L’étape d’uniformisation, connue de l’homme du métier, peut, par exemple, mettre chaque caractère en minuscule, enlever les caractères spéciaux, enlever les accents.In some embodiments, the method 40 includes a step of standardizing the computer data representative of holders stored in the first database. The standardization step, known to those skilled in the art, can, for example, put each character in lowercase, remove special characters, remove accents.
Dans des modes de réalisation, en cas d’égalité entre le nombre d’occurrences, l’étape d’évaluation comporte, une étape de décompte du nombre d’occurrences de chaque classe tronquée parmi chaque brevet, de la première base de données présentant un titulaire correspondant. Le premier ensemble de mots-clés est déterminé en fonction de l’intitulé de la classe tronquée apparaissant le plus grand nombre de fois.In embodiments, in the event of equality between the number of occurrences, the evaluation step comprises a step of counting the number of occurrences of each truncated class among each patent, of the first database presenting a corresponding holder. The first set of keywords is determined based on the title of the truncated class appearing the most times.
Pour associer, au moins un brevet au brevet dont l’identifiant est saisi, l’étape d’évaluation est appliquée à chaque brevet de la première base de données. Puis, la classe prédominante peut être stockée dans un champ de la première base de données. Le premier ensemble de mots-clés associé au brevet donc l’identifiant est saisi présente alors une proximité sémantique élevée avec les autres brevets de la première base de données de même classe prédominante.To associate at least one patent with the patent whose identifier is entered, the evaluation step is applied to each patent in the first database. Then, the predominant class can be stored in a field of the first database. The first set of keywords associated with the patent for which the identifier is entered then presents a high semantic proximity with the other patents of the first database of the same predominant class.
Dans des modes de réalisation, chaque étape d’évaluation est réalisée lors de la construction de la première base de données. Et le champ correspondant au domaine technique évalué est mis à jour lors de mises à jour d’au moins une classe associée à un brevet de la première base de données.In embodiments, each evaluation step is performed during the construction of the first database. And the field corresponding to the technical field evaluated is updated during updates of at least one class associated with a patent in the first database.
Dans des modes de réalisation, l’étape d’association 41 associe au moins un autre brevet de la première base de données correspondant au titulaire du brevet dont l’identifiant est saisi. Dans ces modes de réalisation, un titulaire correspondant est déterminé comme indiqué ci-dessus.In some embodiments, the association step 41 associates at least one other patent from the first database corresponding to the holder of the patent whose identifier is entered. In these embodiments, a corresponding holder is determined as indicated above.
Dans des modes de réalisation, l’étape d’association 41 associe au moins un autre brevet de la première base de données correspondant au premier ensemble de mots-clés de l’identifiant saisi et à un titulaire correspondant. Ces modes de réalisation sont une combinaison des modes de réalisation détaillés ci-dessus.In some embodiments, the association step 41 associates at least one other patent from the first database corresponding to the first set of keywords of the entered identifier and to a corresponding holder. These embodiments are a combination of the embodiments detailed above.
Le procédé 40 comporte une étape de décompte 42 du nombre d’occurrences de chaque code représentatif de la portée géographique en fonction de chaque autre brevet associé brevet dont l’identifiant est saisi.The method 40 includes a step 42 of counting the number of occurrences of each code representative of the geographical scope according to each other patent associated patent whose identifier is entered.
Lors de l’étape de décompte 42, le contenu du champ comportant la zone géographique couverte par le brevet est soumis à un algorithme de tri connu de l’homme du métier pour décompter et classer les zones géographiques par nombre d’occurrences décroissantes. Le classement est stocké temporairement.During the counting step 42, the content of the field comprising the geographical area covered by the patent is subjected to a sorting algorithm known to those skilled in the art to count and classify the geographical areas by decreasing number of occurrences. The ranking is temporarily stored.
Dans des modes de réalisation, les brevets soumis à l’algorithme de tri sont filtrés par titulaire, par exemple, pour les titulaires correspondants ou encore pour les titulaires de même nationalité.In embodiments, the patents submitted to the sorting algorithm are filtered by holder, for example, for the corresponding holders or even for the holders of the same nationality.
Dans des modes de réalisation, l’étape de décompte comporte :
- une étape de sélection d’une valeur prédéterminée X de titulaires classés par nombre d’occurrences décroissantes,
- une étape de décompte 22 du nombre de titres de propriété industrielle de la première base de données de même domaine technique pour chaque titulaire sélectionné,
- une étape de classement 23 de chaque zone par nombre d’occurrences décroissantes.In embodiments, the counting step includes:
- a step of selecting a predetermined value X of holders classified by decreasing number of occurrences,
- a counting step 22 of the number of industrial property titles of the first database of the same technical field for each holder selected,
- A classification step 23 of each zone by decreasing number of occurrences.
Lors de l’étape de sélection, un opérateur spécifie, au moyen d’une interface homme/machine, par exemple un clavier, une souris ou un écran tactile, le nombre de titulaires X à prendre en compte. Dans des modes de réalisation, un choix de valeurs prédéterminées X peut être proposé à l’utilisateur, par exemple, trois, cinq ou dix.During the selection step, an operator specifies, by means of a man/machine interface, for example a keyboard, a mouse or a touch screen, the number of holders X to be taken into account. In embodiments, a choice of predetermined values X can be offered to the user, for example, three, five or ten.
Lors de l’étape de décompte 20, les titulaires correspondants sont considérés comme étant le même titulaire.During counting step 20, the corresponding holders are considered to be the same holder.
Les X titulaires les plus récurrents sont sélectionnés. Un filtrage de la première base de données est effectué pour exclure les titulaires autres que les titulaires sélectionnés.The X most recurring holders are selected. A filtering of the first database is performed to exclude holders other than the selected holders.
Puis pour chaque brevet d’au moins un des X titulaires sélectionnés, on met en œuvre une étape de décompte similaire à l’étape de décompte 42 et indépendante du titulaire du brevet.Then for each patent of at least one of the X selected holders, a counting step similar to the counting step 42 and independent of the patent holder is implemented.
La liste triée est stockée dans une mémoire au moins temporairement.The sorted list is stored in a memory at least temporarily.
Lors de l’étape de pondération 43, chaque statistique nationale du jeu de statistiques nationales sélectionné est pondérée en fonction du nombre d’occurrences. Par exemple, la pondération peut suivre une loi linéaire en fonction du nombre d’occurrences.During the weighting step 43, each national statistic of the selected national statistics set is weighted according to the number of occurrences. For example, the weighting can follow a linear law according to the number of occurrences.
Dans des modes réalisation, chaque statistique nationale est associée à une zone géographique de portée, le procédé 40 comporte, de plus ;
- une étape de définition 44 d’une valeur limite prédéterminée,
- une étape de classement 45 de chaque statistique nationale du jeu de statistiques nationales sélectionné par zone géographique et par valeur décroissante,
- une étape itérative de calcul 46 de la somme de chaque statistique nationale, par ordre de classement, jusqu’à ce que la valeur de la somme soit supérieure ou égale à la valeur limite prédéterminée, et
- lors de l’étape de fourniture 18, les statistiques nationales fournies sont les statistiques nationales utilisées lors de la dernière itération de l’étape de calcul.In embodiments, each national statistic is associated with a geographical area of scope, the method 40 further comprises;
- a step 44 for defining a predetermined limit value,
- a classification step 45 of each national statistic of the set of national statistics selected by geographical area and by decreasing value,
- an iterative step 46 of calculating the sum of each national statistic, in order of classification, until the value of the sum is greater than or equal to the predetermined limit value, and
- During the supply step 18, the national statistics supplied are the national statistics used during the last iteration of the calculation step.
Lors de l’étape de définition 44, un opérateur inscrit une valeur limite prédéterminée au moyen d’une interface homme/machine, par exemple en déplaçant un curseur représentant un pourcentage de marché visé allant de zéro pour cent à cent pour cent. La première valeur limite prédéterminée est ensuite calculée à partir de la valeur du marché sur l’ensemble des zones géographiques.During the definition step 44, an operator enters a predetermined limit value by means of a man/machine interface, for example by moving a slider representing a target market percentage ranging from zero percent to one hundred percent. The first predetermined limit value is then calculated from the market value across all geographical areas.
Lors de l’étape de classement 45, un algorithme de tri est mis en œuvre pour classer les zones géographiques en fonction de la valeur de la donnée statistique nationale de manière décroissante. L’étape de classement 45 est préférentiellement mise en œuvre par un serveur applicatif.During the classification step 45, a sorting algorithm is implemented to classify the geographical areas according to the value of the national statistical data in a decreasing manner. The classification step 45 is preferably implemented by an application server.
Lors de l’étape de calcul 46, on vérifie si la valeur de la zone géographique classée selon le premier rang est supérieure à la valeur limite prédéterminée. Le cas échéant, on passe à l’étape de fourniture 18. Sinon, on calcule la somme de la statistique nationale correspondante à la zone géographique classée au premier rang avec la statistique nationale correspondante à la zone géographique classé au deuxième rang. Si la somme est supérieure à la valeur limite prédéterminée, on passe à l’étape de fourniture 18, sinon on réitère le calcul avec la statistique nationale correspondante à la zone géographique du troisième rang. L’étape de calcul 46 est ainsi itérée jusqu’à ce que la somme soit supérieure à la valeur limite prédéterminée.During calculation step 46, it is checked whether the value of the geographical area classified according to the first rank is greater than the predetermined limit value. If necessary, we go to the supply step 18. Otherwise, we calculate the sum of the national statistic corresponding to the geographical area ranked first with the national statistic corresponding to the geographical area ranked second. If the sum is greater than the predetermined limit value, we move on to supply step 18, otherwise the calculation is repeated with the national statistics corresponding to the geographical area of the third rank. Calculation step 46 is thus iterated until the sum is greater than the predetermined limit value.
Les zones géographiques les plus récurrentes classées par récurrence décroissante. La liste triée est stockée dans une mémoire au moins temporairement.The most recurrent geographical areas classified by decreasing recurrence. The sorted list is stored in a memory at least temporarily.
L’étape de fourniture 18 peut comporter une étape d’affichage réalisée sur un écran, par exemple, au moyen d’un navigateur internet affichant une page internet sécurisée en faisant appel à la hiérarchisation fournie. L’affichage peut être sous forme de carte ou de liste, par exemple.The supply step 18 may include a display step performed on a screen, for example, by means of an internet browser displaying a secure internet page by using the hierarchy provided. The display can be in the form of a map or a list, for example.
Claims (12)
- une étape de conversion (12) de l’identifiant saisi en un premier ensemble de mots-clés représentatifs d’au moins un domaine technique du brevet, dans une première base de données associant au moins un identifiant à un ensemble de mots-clés ;
- une étape de création (13) d’une requête de collecte d’informations statistiques nationales, accessibles sur un réseau, en fonction des mots-clés résultant de la conversion et, pour chaque dite information, un deuxième ensemble de mots-clés associés à ladite information,
- une étape de comparaison (14) du premier ensemble de mots-clés et de chaque deuxième ensemble,
- une étape d’affectation (15) d’un poids à chaque information représentative du jeu de statistiques nationales collectée en fonction du résultat de la comparaison,
- une étape de hiérarchisation (16) du jeu de statistiques nationales en fonction du poids de chaque dite information,
- une étape de sélection (17) d’au moins un jeu de statistiques nationales parmi les jeux de statistiques nationales hiérarchisées et
- une étape de fourniture (18) de chaque dite statistique nationale du jeu de statistiques nationales sélectionnée.Method (10, 40) for supplying relevant information associated with a patent which comprises a step of entering (11) at least one patent identifier, characterized in that it comprises:
- a step of converting (12) the identifier entered into a first set of keywords representative of at least one technical field of the patent, in a first database associating at least one identifier with a set of keywords ;
- a step of creating (13) a request for collecting national statistical information, accessible on a network, according to the keywords resulting from the conversion and, for each said piece of information, a second set of associated keywords to said information,
- a step of comparing (14) the first set of keywords and each second set,
- a step of assigning (15) a weight to each item of information representative of the set of national statistics collected according to the result of the comparison,
- a step of prioritization (16) of the set of national statistics according to the weight of each said piece of information,
- a selection stage (17) of at least one set of national statistics from among the sets of hierarchical national statistics and
- a step of supplying (18) each said national statistic of the set of national statistics selected.
- une étape (22) de collecte et d’indexation d’identifiants publics d’au moins un brevet et
- une étape (23) d’association, à chaque brevet dont les données publiques sont indexées, au moins une information représentative d’au moins un mot-clé.Method (10,40) according to claim 1, which comprises, upstream of the input step (11), a step of constructing the first database which comprises:
- a step (22) of collecting and indexing public identifiers of at least one patent and
- a step (23) of association, with each patent whose public data is indexed, at least one item of information representative of at least one keyword.
- une étape (32) de collecte et d’indexation de jeux de statistiques nationales,
- une étape (33) d’association, à chaque jeu de statistiques nationales indexé, au moins une information représentative d’au moins un mot-clé.Method (10,40) according to one of Claims 1 to 6, which comprises a step of building (31) the second database comprising:
- a step (32) for collecting and indexing sets of national statistics,
- a step (33) for associating, with each set of indexed national statistics, at least one item of information representative of at least one keyword.
- une étape d’association (41) d’au moins un autre brevet de la première base de données correspondant au premier ensemble de mots-clés de l’identifiant saisi et/ou au titulaire du titre,
- une étape de décompte (42) du nombre d’occurrences de chaque code représentatif de la portée géographique en fonction de chaque autre brevet associé brevet dont l’identifiant est saisi;
- une étape de pondération (43) de chaque statistique nationale du jeu de statistiques nationales sélectionné en fonction du nombre d’occurrences,
- lors de l’étape de fourniture (18), le jeu de statistiques nationales est classé par pondération décroissante.Method (140) according to one of Claims 1 to 10, in which the first database comprises, for each patent, an identification of at least one holder and a code representative of the geographical scope, the method further comprising :
- a step of associating (41) at least one other patent from the first database corresponding to the first set of keywords of the identifier entered and/or to the holder of the title,
- a step of counting (42) the number of occurrences of each code representative of the geographical scope as a function of each other patent associated patent whose identifier is entered;
- a step of weighting (43) each national statistic of the set of national statistics selected according to the number of occurrences,
- During the supply step (18), the set of national statistics is classified by decreasing weighting.
- une étape de définition (44) d’une valeur limite prédéterminée,
- une étape de classement (45) de chaque statistique nationale du jeu de statistiques nationales sélectionné par zone géographique et par valeur décroissante,
- une étape itérative de calcul (46) de la somme de chaque statistique nationale, par ordre de classement, jusqu’à ce que la valeur de la somme soit supérieure ou égale à la valeur limite prédéterminée, et
- lors de l’étape de fourniture (18), les statistiques nationales fournies sont les statistiques nationales utilisées lors de la dernière itération de l’étape de calcul.Method (40) according to one of claims 1 to 11, in which each national statistic is associated with a geographical area of scope, the method further comprises;
- a step of defining (44) a predetermined limit value,
- a classification step (45) of each national statistic of the set of national statistics selected by geographical area and by decreasing value,
- an iterative step of calculating (46) the sum of each national statistic, by ranking order, until the value of the sum is greater than or equal to the predetermined limit value, and
- During the supply step (18), the national statistics supplied are the national statistics used during the last iteration of the calculation step.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/FR2020/050219 WO2020169898A1 (en) | 2019-02-21 | 2020-02-07 | Method for proviing relevant information associated with a patent |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1901737 | 2019-02-21 | ||
FR1901737A FR3093202A1 (en) | 2019-02-21 | 2019-02-21 | PROCESS FOR DETERMINING A BEHAVIORAL DIAGRAM |
FR1904733 | 2019-05-06 | ||
FR1904733A FR3093200A1 (en) | 2019-02-21 | 2019-05-06 | PROCESS FOR DETERMINING A BEHAVIORAL DIAGRAM |
Publications (1)
Publication Number | Publication Date |
---|---|
FR3093201A1 true FR3093201A1 (en) | 2020-08-28 |
Family
ID=68501719
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR1906931A Withdrawn FR3093201A1 (en) | 2019-02-21 | 2019-06-26 | PROCEDURE FOR PROVIDING RELEVANT INFORMATION ASSOCIATED WITH A PATENT |
Country Status (1)
Country | Link |
---|---|
FR (1) | FR3093201A1 (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1184798A2 (en) * | 1997-06-02 | 2002-03-06 | Aurigin Systems, Inc. | System , method and computer program product for patent-centric and group-oriented data processing |
-
2019
- 2019-06-26 FR FR1906931A patent/FR3093201A1/en not_active Withdrawn
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1184798A2 (en) * | 1997-06-02 | 2002-03-06 | Aurigin Systems, Inc. | System , method and computer program product for patent-centric and group-oriented data processing |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Edastama et al. | Implementation of data mining on glasses sales using the apriori algorithm | |
CN106156127B (en) | Method and device for selecting data content to push to terminal | |
EP1214669B1 (en) | Method for thematic classification of documents, thematic classification module and search engine incorporating such a module | |
KR101031449B1 (en) | Systems and methods for search query processing using trend analysis | |
EP3401870A1 (en) | Apparatus, systems, and methods for batch and realtime data processing | |
US20140207786A1 (en) | System and methods for computerized information governance of electronic documents | |
CN102866990A (en) | Thematic conversation method and device | |
CN103314371A (en) | Retrieval method and system | |
Usman et al. | Discovering diverse association rules from multidimensional schema | |
CN110442670B (en) | Consumer portrait generation method based on text indexing | |
CN115062158A (en) | Sensitive information knowledge graph construction method and device and sensitive information determination method | |
CN114707059A (en) | Water conservancy object metadata recommendation system construction method based on user preference | |
CN105608118B (en) | Result method for pushing based on customer interaction information | |
CN112784049B (en) | Text data-oriented online social platform multi-element knowledge acquisition method | |
EP1635273A1 (en) | electronic generation of a lexical tree | |
FR2902913A1 (en) | Semantic and spatial similarity note calculating and encoding method for tourism field, involves calculating and encoding semantic and spatial note by relatively comparing with respective common semantic characteristics | |
FR3093201A1 (en) | PROCEDURE FOR PROVIDING RELEVANT INFORMATION ASSOCIATED WITH A PATENT | |
WO2020169898A1 (en) | Method for proviing relevant information associated with a patent | |
CN115828243A (en) | Static code flow analysis method based on scanning scheme | |
FR3093200A1 (en) | PROCESS FOR DETERMINING A BEHAVIORAL DIAGRAM | |
CN115691702A (en) | Compound visual classification method and system | |
CN116303983A (en) | Keyword recommendation method and device and electronic equipment | |
CN113127465A (en) | Data fusion method and system | |
CN105138544B (en) | A kind of searching method for remolding logical deduction chain | |
Staegemann et al. | Classifying Big Data Taxonomies: A Systematic Literature Review. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PLFP | Fee payment |
Year of fee payment: 2 |
|
PLSC | Publication of the preliminary search report |
Effective date: 20200828 |
|
ST | Notification of lapse |
Effective date: 20220205 |