FR2817638A1 - Method for universal coding of product characteristics, comprises attribution of unique codes to product and to product characteristics independantly of language and construction of a coding tree - Google Patents

Method for universal coding of product characteristics, comprises attribution of unique codes to product and to product characteristics independantly of language and construction of a coding tree Download PDF

Info

Publication number
FR2817638A1
FR2817638A1 FR0015788A FR0015788A FR2817638A1 FR 2817638 A1 FR2817638 A1 FR 2817638A1 FR 0015788 A FR0015788 A FR 0015788A FR 0015788 A FR0015788 A FR 0015788A FR 2817638 A1 FR2817638 A1 FR 2817638A1
Authority
FR
France
Prior art keywords
product
objects
coding
tree
lexicalogical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
FR0015788A
Other languages
French (fr)
Inventor
Jean Paul Berthelot
Jean Luc Tromparent
Mahyar Pourrastegar
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AD LIBITUM SA
Original Assignee
AD LIBITUM SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AD LIBITUM SA filed Critical AD LIBITUM SA
Priority to FR0015788A priority Critical patent/FR2817638A1/en
Publication of FR2817638A1 publication Critical patent/FR2817638A1/en
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

In a first stage (1) a product (A) is coded 1501 and the product characteristics (B,C,D,E) are coded 6189,4354,5002,2130. The coding and arrangement into a tree is independent of the descriptive language and produced by a computer using a memorized dictionary and a lexicological process. The product and characteristic codes are distributed in levels (N1,N2) and a universal coder (2) produces a universal single dimension coding (3)

Description

<Desc/Clms Page number 1> <Desc / Clms Page number 1>

La présente invention concerne un procédé de codage universel des caractéristiques de produits quelconques, manufacturés ou non, appartenant ou non à un standard, pour faciliter leur recherche dans des bases de données informatiques.  The present invention relates to a universal coding method for the characteristics of any products, whether manufactured or not, belonging or not to a standard, to facilitate their search in computer databases.

IL s'applique notamment, à la vente à distance par l'intermédiaire d'un réseau téléphonique commuté ou d'un réseau de radiotéléphone cellulaire (WAP), à la traduction automatique, ainsi qu'à la définition de profils par les "internautes"du réseau Internet à l'aide des éléments constitutifs de leurs requêtes.  It applies in particular to distance selling via a switched telephone network or a cellular radiotelephone network (WAP), to automatic translation, as well as to the definition of profiles by "Internet users "from the Internet using the building blocks of their queries.

La vente d'un produit s'accompagne généralement d'une publicité consistant à le décrire par ses caractéristiques essentielles. Ainsi par exemple, pour vendre une maison, l'agent immobilier va tout d'abord s'attacher à en faire une description synthétique en énumérant, le type de pièces ; cave, cuisine, salle de séjour, chambres, salle de bains etc. en précisant éventuellement, leurs surfaces et leurs expositions. Egalement, il peut donner des précisions concernant le moyen de chauffage, l'existence d'un jardin ou celle d'autres commodités concernant par exemple les commerces et les moyens de transport situés à proximité. Ces caractéristiques essentielles de la maison et de son environnement sont ainsi consignées sous la forme d'une fiche descriptive afin d'exposition dans une vitrine publicitaire de l'agence, de parution sous la forme d'annonce dans un journal ou encore sur un site Internet spécialisé dans le domaine des transactions immobilières regroupant dans une même base de données de produits ou dans des documents électroniques contenant des descriptifs de produits l'ensemble des annonces faîtes par plusieurs agences immobilières.  The sale of a product is generally accompanied by an advertisement consisting in describing it by its essential characteristics. So for example, to sell a house, the real estate agent will first of all endeavor to make a synthetic description by listing, the type of rooms; cellar, kitchen, living room, bedrooms, bathroom etc. possibly specifying their surfaces and their exposures. Also, he can give details concerning the heating means, the existence of a garden or that of other conveniences concerning for example the shops and the means of transport located nearby. These essential characteristics of the house and its environment are thus recorded in the form of a descriptive card in order to exhibit in an advertising window of the agency, to appear in the form of an advertisement in a newspaper or on a site. Internet specialized in the field of real estate transactions grouping in the same product database or in electronic documents containing product descriptions all the announcements made by several real estate agencies.

<Desc/Clms Page number 2> <Desc / Clms Page number 2>

Mais la mise à la disposition du public de ces fiches descriptives oblige les acheteurs potentiels à effectuer une recherche fastidieuse dans des listes très importantes d'annonces immobilières pour sélectionner la maison qui leur paraît satisfaire au mieux au profil de celle qu'il recherche. But the availability of these descriptive sheets to the public obliges potential buyers to carry out a tedious search in very large lists of real estate advertisements to select the house that seems to them to best meet the profile of the one they are looking for.

Plusieurs mécanismes ont été développés pour faciliter des recherches de produits et ceux ci effectuent pour la plus part une comparaison entre un profil qui est établie à partir d'une requête du demandeur définissant le produit recherché et l'ensemble des critères inscrits dans une base de données.  Several mechanisms have been developed to facilitate research of products and these perform for the most part a comparison between a profile which is established on the basis of a request from the applicant defining the product sought and all the criteria entered in a database. data.

Cependant la vitesse d'exécution de ces recherches et les résultats obtenus dépendent pour beaucoup de la manière dont sont définis les profils et de la méthode utilisée pour y accéder, soit que le demandeur formule sa requête à partir de mots clés ou qu'il réponde successivement à des questions qui lui sont posées par le système informatique, soit encore que les éléments caractéristiques du profil du produit recherché sont obtenus à partir d'une analyse"plein texte" du texte de la requête. Ces disparités dans les recherches entraînent des disparités dans les résultats obtenus, ce qui pour les utilisateurs de ces bases de données n'est pas satisfaisant et même déconcertant.  However, the speed of execution of these searches and the results obtained largely depend on the way in which the profiles are defined and on the method used to access them, whether the requester formulates his request using keywords or whether he responds successively to questions put to it by the computer system, that is to say that the characteristic elements of the profile of the product sought are obtained from a "full text" analysis of the text of the request. These disparities in research lead to disparities in the results obtained, which for the users of these databases is not satisfactory and even disconcerting.

A cela s'ajoute une autre difficulté qui est due à la langue utilisée pour établir les profils et qui oblige à effectuer des traductions au niveau des requêtes et des résultats lorsque le demandeur pratique une langue différente de celle qui a été utilisée pour établir les profils.  To this is added another difficulty which is due to the language used to establish the profiles and which obliges to carry out translations at the level of the requests and results when the applicant practices a language different from that which was used to establish the profiles .

Le but de l'invention est de pallier les inconvénients précités.  The object of the invention is to overcome the aforementioned drawbacks.

A cet effet, l'invention a pour objet, un procédé de codage universel de caractéristiques de produits permettant leur recherche dans des bases de données ou dans des documents électroniques contenant des descriptifs de produits  To this end, the subject of the invention is a method of universal coding of product characteristics enabling them to be searched in databases or in electronic documents containing product descriptions.

<Desc/Clms Page number 3><Desc / Clms Page number 3>

caractérisé en ce qu'il consiste à attribuer un code aux produits ainsi qu'à chacune de leurs caractéristiques de façon unique et indépendante de la langue utilisée pour les décrire en faisant pour cela usage d'un dictionnaire mémorisé dans une mémoire ou une base de données couplée à des moyens de traitement de données d'un ordinateur et, par un procédé d'assemblage lexicalogique programmé dans l'ordinateur, à construire un arbre de codage dont la racine est constituée par le code représentatif du produit et les feuilles sont réparties par niveaux et sont constituées des codes représentatifs des caractéristiques du produit, et à projeter l'arbre de codage dans un espace à une dimension pour obtenir une codification des caractéristiques du produit.  characterized in that it consists in assigning a code to the products as well as to each of their characteristics in a unique manner and independent of the language used to describe them by using for this purpose a dictionary stored in a memory or a database data coupled to data processing means of a computer and, by a lexicalogical assembly process programmed in the computer, to construct a coding tree whose root is constituted by the representative code of the product and the sheets are distributed by levels and consist of codes representative of the characteristics of the product, and to project the coding tree into a one-dimensional space to obtain a codification of the characteristics of the product.

Le procédé selon l'invention a pour avantage qu'il permet la recherche de produits dont les caractéristiques sont décrites en langage naturel, par interrogation de bases de données informatiques, l'accès aux bases de données pouvant être obtenu par exemple à partir de serveurs couplés au réseau Internet.  The method according to the invention has the advantage that it makes it possible to search for products whose characteristics are described in natural language, by interrogating computer databases, access to databases being obtainable for example from servers. coupled to the Internet.

La compréhension des notions existante dans un descriptif de produit à l'aide d'un composant logiciel lexicalogique mis en oeuvre conformément au procédé selon l'invention a aussi pour avantages qu'elle permet : - une interchangeabilité des composants logiciels, un même composant pouvant être utilisé dans des domaines différents, - une facilité de développement de plusieurs outils et langages de programmation, et une indépendance linguistique, la composition logique d'un objet étant indépendante de la langue qui le décrit. De ce fait le procédé d'analyse Lexicalogique selon l'invention ne dépend de la langue qu'au niveau des composants Lexicologiques.  Understanding the concepts existing in a product description using a lexicalogical software component implemented in accordance with the method according to the invention also has the advantages that it allows: - interchangeability of software components, the same component being able to be used in different fields, - ease of development of several programming tools and languages, and linguistic independence, the logical composition of an object being independent of the language which describes it. Therefore the Lexicalogical analysis method according to the invention depends on the language only at the level of Lexicological components.

<Desc/Clms Page number 4> <Desc / Clms Page number 4>

D'autres caractéristiques et avantages de l'invention apparaîtront à l'aide de la description qui suit faite en regard des dessins annexés qui représentent :
La figure 1 une illustration du procédé de codage universel de l'invention mis sous la forme d'un organigramme.
Other characteristics and advantages of the invention will become apparent from the following description given with reference to the appended drawings which represent:
Figure 1 an illustration of the universal coding method of the invention put in the form of a flowchart.

Les figures 2a à 2d une illustration des règles logiques utilisées dans la mise en oeuvre du procédé selon l'invention.  FIGS. 2a to 2d an illustration of the logical rules used in the implementation of the method according to the invention.

La figure 3 un exemple de constitution d'un arbre lexicalogique selon l'invention.  Figure 3 an example of constitution of a lexicalogic tree according to the invention.

La figure 4 les différentes étapes du procédé selon l'invention mises sous la forme d'un organigramme.  Figure 4 the different steps of the method according to the invention put in the form of a flowchart.

La figure 5 un schéma pour illustrer la réalisation de liens entre objets lexicalogiques.  Figure 5 a diagram to illustrate the realization of links between lexicalogical objects.

Le procédé de codage universel selon l'invention qui est représenté à la figure 1, consiste à attribuer un code aux produits ainsi qu'à chacune de leurs caractéristiques de façon unique et indépendante de la langue utilisée pour les décrire en faisant pour cela usage d'un dictionnaire mémorisé dans une mémoire ou une base de données d'un ordinateur de type connu non représenté et à construire par un procédé d'assemblage lexicalogique, un arbre de codage dont la racine est constituée par le code représentatif du produit et les feuilles sont réparties par niveaux et sont constituées des codes représentatifs des caractéristiques du produit. Le code définissant entièrement le produit est obtenu par une projection de l'arbre de codage dans un espace à une seule dimension.  The universal coding method according to the invention which is represented in FIG. 1, consists in assigning a code to the products as well as to each of their characteristics in a unique way and independent of the language used to describe them by making use for this purpose. '' a dictionary stored in a memory or a database of a known type of computer not shown and to be constructed by a lexicalogical assembly process, a coding tree whose root is constituted by the representative code of the product and the sheets are divided by levels and consist of codes representative of the characteristics of the product. The code entirely defining the product is obtained by projecting the coding tree into a one-dimensional space.

Dans l'exemple de la figure 1, le produit A est codé avec le code 1501 et ses caractéristiques B, C, D, E sont codées suivant les codes respectifs 6189,4354, 5002,2130.  In the example of FIG. 1, the product A is coded with the code 1501 and its characteristics B, C, D, E are coded according to the respective codes 6189,4354, 5002,2130.

L'arbre de codage qui résulte de l'analyse lexicalogique est représentée à l'intérieur du bloc 1. Il comporte une racine identifiant par son code le produit A et deux niveaux de feuilles, un premier niveau NI regroupant les codes des The coding tree which results from the lexicalogical analysis is represented inside block 1. It comprises a root identifying by its code the product A and two levels of sheets, a first level NI grouping together the codes of the

<Desc/Clms Page number 5><Desc / Clms Page number 5>

caractéristiques B et C et un deuxième niveau N2 regroupant les codes des sous caractéristiques D et E de la caractéristique B. La projection est effectuée par les blocs 2 et 3, elle a pour résultat la suite des codes 1501 (6189 (5002,2130), 4354), les parenthèses marquant le début et la fin de chaque niveau de l'arbre de codage.  characteristics B and C and a second level N2 grouping the codes of sub-characteristics D and E of characteristic B. The projection is carried out by blocks 2 and 3, it results in the following codes 1501 (6189 (5002,2130) , 4354), the parentheses marking the beginning and the end of each level of the coding tree.

Pour réaliser ce codage un dictionnaire universel contenu dans une mémoire couplée à des moyens de traitement d'un ordinateur non représentés, permet d'associer à un objet ou ses caractéristiques, des identifiants numériques uniques (INU).  To carry out this coding, a universal dictionary contained in a memory coupled to processing means of a computer not shown, makes it possible to associate with an object or its characteristics, unique digital identifiers (INU).

La codification est effectuée par les moyens de traitement de l'ordinateur par l'exécution d'un programme consistant à parcourir l'arbre de codage en commençant par la branche de gauche en plaçant une parenthèse à chaque passage d'un niveau de code au suivant. Les codes de même niveau sont regroupés à l'intérieur d'une même parenthèse, chaque parenthèse marquant le début et la fin de chaque niveau de l'arbre.  The coding is carried out by the processing means of the computer by the execution of a program consisting in traversing the coding tree starting with the left branch by placing a parenthesis at each passage from a level of code to next. Codes of the same level are grouped together within the same parenthesis, each parenthesis marking the beginning and the end of each level of the tree.

Il est possible de conserver les codes universels dans un référentiel ou un système de gestion de bases de données afin de permettre des recherches automatiques de produits à l'aide d'un référentiel ou d'un moteur de recherche.  It is possible to keep the universal codes in a repository or a database management system in order to allow automatic product searches using a repository or a search engine.

La recherche peut alors s'effectuer en comparant dans l'ordinateur un code universel provenant d'une requête avec les codes universels issus d'un ensemble de produits E.  The search can then be carried out by comparing in the computer a universal code coming from a query with the universal codes coming from a set of products E.

Le résultat est alors un ensemble de produits E', sousensemble de E, pour lesquels le code universel est inclus dans le code universel R.

Figure img00050001
The result is then a set of products E ', subset of E, for which the universal code is included in the universal code R.
Figure img00050001

Dans ce processus un code universel U1 est dit inclus dans un code universel U2 si l'ensemble des INU de U1 sont présents dans l'ensemble des INU deU2 et si la hiérarchie des INU de Ul, symbolisée par les parenthèses, est incluse dans la hiérarchie des INU de U2. In this process a universal code U1 is said to be included in a universal code U2 if the set of INUs of U1 are present in the set of INUs of U2 and if the hierarchy of INUs of U1, symbolized by parentheses, is included in the INU hierarchy of U2.

<Desc/Clms Page number 6> <Desc / Clms Page number 6>

Une hiérarchie Hl est dite incluse dans une hiérarchie H2 si tous les liens hiérarchiques de Hl sont présents dans H2. A hierarchy Hl is said to be included in a hierarchy H2 if all the hierarchical links of Hl are present in H2.

Pour modifier les caractéristiques existantes dans le descriptif d'un produit le procédé selon l'invention fait appel à des règles de déduction inscrites dans une mémoire de l'ordinateur qui permettent l'ajout ou la suppression d'un ensemble d'objets ou de caractéristiques en fonction de règles logiques.  To modify the existing characteristics in the description of a product, the method according to the invention uses deduction rules written in a memory of the computer which allow the addition or deletion of a set of objects or characteristics according to logical rules.

Une règle de déduction est définie par trois ensembles.  A deduction rule is defined by three sets.

Un ensemble de départ, un ensemble d'arrivé constitués des objets et des caractéristiques et un ensemble de conditions. A starting set, a finishing set made up of objects and characteristics and a set of conditions.

L'ensemble de départ entraîne l'ensemble d'arrivé si les conditions définies dans l'ensemble de conditions sont satisfaites. The start set leads to the finish set if the conditions defined in the set of conditions are satisfied.

Les règles de déduction logique sont complètement hiérarchisées. Plusieurs règles sont appliquées selon leurs hiérarchies, celles ci permettent par exemple, soit d'élaborer une décision logique en cas d'existence ou d'absence de caractéristiques ou de propriété d'une proposition soit, de déclencher un calcul, soit d'effectuer une conversion entre objets, soit encore de détecter des anomalies. Les règles de type déduction logique ont l'avantage qu'elles permettent d'apporter une correction éventuelle aux descriptifs d'un produit. Ces règles ne sont pas obligatoirement réciproques.  The rules of logical deduction are completely hierarchical. Several rules are applied according to their hierarchies, these allow for example, either to develop a logical decision in the event of the existence or absence of characteristics or ownership of a proposal or, to trigger a calculation, or to perform conversion between objects, or even to detect anomalies. Logical deduction type rules have the advantage that they make it possible to make a possible correction to the descriptions of a product. These rules are not necessarily reciprocal.

La figure 2a montre un exemple où une combinaison de deux caractéristiques A et B entraîne l'ajout d'une caractéristique F. La figure 2b montre un cas ou l'absence d'une caractéristique M entraîne l'ajout d'autres caractéristiques F, G, H, I.  FIG. 2a shows an example where a combination of two characteristics A and B results in the addition of a characteristic F. FIG. 2b shows a case where the absence of a characteristic M results in the addition of other characteristics F, G, H, I.

La figure 2c illustre une règle de calcul permettant de calculer dynamiquement le nombre d'objets de type A par exemple.  FIG. 2c illustrates a calculation rule making it possible to dynamically calculate the number of type A objects for example.

<Desc/Clms Page number 7> <Desc / Clms Page number 7>

La figure 2d montre l'exécution d'une règle de conversion où un certain nombre d'objets de type A sont convertis en un autre nombre d'objets de type B.  Figure 2d shows the execution of a conversion rule where a certain number of type A objects are converted into another number of type B objects.

L'arbre de codage d'un produit décrit précédemment est défini par une analyse lexicalogique permettant à partir d'un texte exprimé en langage naturel, semi-structuré ou structuré de retrouver la composition logique d'un produit appartenant à un domaine. Cette analyse se base sur un réseau, appelé "arbre lexicalogique", modélisant la composition logique d'un domaine de produits, et leurs caractéristiques communes.  The coding tree of a product described above is defined by a lexicalogical analysis allowing from a text expressed in natural language, semi-structured or structured to find the logical composition of a product belonging to a domain. This analysis is based on a network, called "lexicalogical tree", modeling the logical composition of a domain of products, and their common characteristics.

Ainsi un"arbre lexicalogique"est défini par : les objets qui composent un domaine, par exemple le domaine"logement", les caractéristiques spécifiques à chaque objet, par exemple : "Maison de campagne", les caractéristiques communes à plusieurs objets, par exemple :"Surface", - les règles logiques existantes entre objets, par exemple : "Maison + Piscine = > (implique) Jardin" les relations existantes entre les objets, par exemple : Logement- > "Jardin"

Figure img00070001

les composants logiciels autonomes d'analyse, les composant logiciels de déduction. Thus a "lexicalogical tree" is defined by: the objects that make up a domain, for example the domain "accommodation", the characteristics specific to each object, for example: "Country house", the characteristics common to several objects, for example : "Surface", - the existing logical rules between objects, for example: "House + Pool => (implies) Garden" the existing relationships between objects, for example: Housing->"Garden"
Figure img00070001

autonomous analysis software components, deduction software components.

L'arbre lexicalogique représenté à la figure 3, montre une composition logique établie pour modéliser un logement comportant un jardin et une piscine, avec une caractéristique commune qui est la surface.  The lexicalogical tree represented in figure 3, shows a logical composition established to model a housing comprising a garden and a swimming pool, with a common characteristic which is the surface.

Le procédé mis en oeuvre selon l'invention se déroule suivant les étapes référencées de 4 à 7 sur l'organigramme de la figure 4. Il consiste à identifier dans une première étape référencée 4, chaque caractéristique du produit analysé à l'aide d'un composant logiciel autonome dépendant de la langue avec laquelle le texte a été composé. A établir au cours d'une deuxième étape référencée 5, les liens entre les  The method implemented according to the invention takes place according to the steps referenced from 4 to 7 on the flowchart of FIG. 4. It consists in identifying in a first step referenced 4, each characteristic of the product analyzed using a standalone software component depending on the language in which the text was composed. To be established during a second stage referenced 5, the links between the

<Desc/Clms Page number 8><Desc / Clms Page number 8>

caractéristiques obtenues à l'étape précédente en se basant sur l'arbre lexicalogique, indépendamment de la langue. A enrichir au cours d'une troisième étape référencée 6 le résultat obtenu à la deuxième étape par des déductions logiques selon les règles définies dans l'arbre lexicalogique câblées dans des composants autonomes de déduction. Enfin à codifier lors d'une quatrième étape référencée 7, les résultats de la troisième étape en appliquant la règle de codage décrite précédemment.  characteristics obtained in the previous step based on the lexicalogical tree, regardless of the language. To be enriched during a third step referenced 6 the result obtained in the second step by logical deductions according to the rules defined in the lexicalogical tree wired in autonomous deduction components. Finally, to code during a fourth step referenced 7, the results of the third step by applying the coding rule described above.

L'exécution de l'étape 4 s'effectue à l'aide de composants logiciels lexicalogiques autonomes capables d'identifier un objet ou une caractéristique de manière non ambiguë, appartenant à un ou plusieurs domaines de produits. Un composant logiciel lexicalogique se charge de la compréhension atomique des notions existantes dans le descriptif d'un produit. A titre d'exemple un composant lexicalogique est capable d'identifier, un objet par exemple :"Jardin", une ou plusieurs caractéristiques spécifiques à l'objet par exemple : "de contemplation", une ou plusieurs composantes génériques par exemple : "Beau, Grand, Moderne".  The execution of step 4 is carried out using autonomous lexicalogical software components capable of identifying an object or characteristic unambiguously, belonging to one or more product areas. A lexicalogical software component takes care of the atomic understanding of the existing concepts in the description of a product. As an example, a lexicalogical component is capable of identifying, an object for example: "Garden", one or more characteristics specific to the object for example: "of contemplation", one or more generic components for example: "Beautiful , Large, Modern ".

L'exécution de l'étape 5 s'effectue à l'aide d'un automate lexicalogique programmé dans l'ordinateur qui permet d'établir des liens entre un ensemble d'objets, obtenus par les composants lexicalogiques. Les règles selon lesquelles l'automate décide de relier les objets sont basées sur l'arbre lexicalogique d'une part, et sur la langue avec laquelle le produit a été décrit, d'autre part. Le tout est assemblé dans un composant logiciel autonome, permettant ainsi de modifier les règles à volonté. The execution of step 5 is carried out using a lexicalogical automaton programmed in the computer which makes it possible to establish links between a set of objects, obtained by the lexicalogical components. The rules according to which the automaton decides to link the objects are based on the lexicalogical tree on the one hand, and on the language with which the product was described, on the other hand. The whole is assembled in a standalone software component, thus allowing to modify the rules at will.

Claims (8)

Revendicationsclaims 1-Procédé de codage universel de caractéristiques de produits permettant leur recherche dans des bases de données ou dans des documents électroniques contenant des descriptifs de produits caractérisé en ce qu'il consiste à attribuer un code aux produits ainsi qu'à chacune de leurs caractéristiques de façon unique et indépendante de la langue utilisée pour les décrire en faisant pour cela usage d'un dictionnaire mémorisé dans une mémoire ou une base de données couplée à des moyens de traitement de données d'un ordinateur et, par un procédé d'assemblage lexicalogique programmé dans l'ordinateur, à construire (1) un arbre de codage dont la racine est constituée par le code représentatif du produit et les feuilles sont réparties par niveaux et sont constituées des codes représentatifs des caractéristiques du produit, et à projeter (2) l'arbre de codage dans un espace à une dimension pour obtenir une codification des caractéristiques du produit.  1-Process for universal coding of product characteristics allowing their search in databases or in electronic documents containing product descriptions, characterized in that it consists in assigning a code to the products as well as to each of their characteristics. unique and independent way of the language used to describe them by making use of a dictionary stored in a memory or a database coupled to data processing means of a computer and, by a lexicalogical assembly process programmed in the computer, to build (1) a coding tree whose root is constituted by the code representative of the product and the sheets are distributed by levels and are made up of codes representative of the characteristics of the product, and to be projected (2) the coding tree in a one-dimensional space to obtain a codification of the characteristics of the product. 2-Procédé selon la revendication 1 caractérisé en ce que la codification est effectuée en parcourant l'arbre de codage en commençant par la branche de gauche en plaçant une parenthèse à chaque passage d'un niveau de code au suivant, et en regroupant les codes de même niveau à l'intérieur d'une même parenthèse, chaque parenthèse marquant le début et la fin de chaque niveau de l'arbre.  2-A method according to claim 1 characterized in that the coding is carried out by browsing the coding tree starting with the left branch by placing a parenthesis at each passage from one level of code to the next, and by grouping the codes of the same level within the same parenthesis, each parenthesis marking the beginning and the end of each level of the tree. 3-Procédé selon l'une quelconque des revendications 1 et 2 caractérisé en ce qu'il consiste pour effectuer la recherche d'un produit à comparer dans l'ordinateur un code universel provenant d'une requête avec les codes universels issus d'un ensemble de produits E.  3-A method according to any one of claims 1 and 2 characterized in that it consists in performing the search for a product to compare in the computer a universal code from a request with the universal codes from a set of products E. 4-Procédé selon l'une quelconque des revendications 1 à 3 caractérisé en ce qu'il consiste à modifier les caractéristiques existantes dans le descriptif d'un produit  4-A method according to any one of claims 1 to 3 characterized in that it consists in modifying the existing characteristics in the description of a product <Desc/Clms Page number 10><Desc / Clms Page number 10> par application de règles de déduction logiques, inscrites dans une mémoire de l'ordinateur, permettant l'ajout ou la suppression d'un ensemble d'objets ou de caractéristiques à partir de caractéristiques prédéterminées.  by applying logical deduction rules, stored in a computer memory, allowing the addition or deletion of a set of objects or characteristics from predetermined characteristics. 5-Procédé selon la revendication 4 caractérisé en ce qu'il consiste à effectuer des calculs sur des objets en cas de présence ou d'absence de caractéristiques dans un descriptif de produit.  5-A method according to claim 4 characterized in that it consists in performing calculations on objects in the presence or absence of characteristics in a product description. 6-Procédé selon l'une quelconque des revendications 4 et 5 caractérisé en ce qu'il consiste à convertir des objets d'un type déterminé en objets d'un autre type par application de règles de déduction inscrites en mémoire dans l'ordinateur.  6-A method according to any one of claims 4 and 5 characterized in that it consists in converting objects of a determined type into objects of another type by application of deduction rules stored in memory in the computer. 7-Procédé selon l'une quelconque des revendications 1 à 6 caractérisé en ce qu'il consiste : - à identifier (4) dans une première étape, chaque caractéristique du produit analysé à l'aide d'un composant logiciel autonome dépendant de la langue avec laquelle le texte a été composé, - à établir (5) au cours d'une deuxième étape, les liens entre les caractéristiques obtenues à l'étape précédente en se basant sur l'arbre lexicalogique, indépendamment de la langue, - à enrichir (6) au cours d'une troisième étape le résultat obtenu à la deuxième étape par des déductions logiques câblées dans des composants autonomes de déduction, - et à codifier (7) lors d'une quatrième étape, les résultats de la troisième étape en projetant (2) l'arbre de codage lexicalogique enrichi dans un espace à une dimension pour obtenir une codification des caractéristiques du produit.  7-A method according to any one of claims 1 to 6 characterized in that it consists: - in identifying (4) in a first step, each characteristic of the product analyzed using a standalone software component dependent on the language with which the text was composed, - to establish (5) during a second step, the links between the characteristics obtained in the previous step based on the lexicalogical tree, regardless of the language, - to enrich (6) during a third step the result obtained in the second step by logical deductions wired into autonomous deduction components, - and to code (7) during a fourth step, the results of the third step by projecting (2) the enriched lexicalogical coding tree in a one-dimensional space to obtain a codification of the characteristics of the product. 8-Procédé selon l'une quelconque des revendications 1 à 7 caractérisé en ce que un"arbre lexicalogique est défini par :  8-A method according to any one of claims 1 to 7 characterized in that a "lexicalogical tree is defined by: <Desc/Clms Page number 11><Desc / Clms Page number 11> les objets qui composent un domaine, les caractéristiques spécifiques à chaque objet, les caractéristiques communes à plusieurs objets, les règles logiques existantes entre les objets, les relations existantes entre les objets, les composants logiciels autonomes d'analyse, ainsi que par les composants logiciels de déduction. the objects that make up a domain, the characteristics specific to each object, the characteristics common to several objects, the existing logical rules between the objects, the relationships existing between the objects, the autonomous analysis software components, as well as by the software components deduction.
FR0015788A 2000-12-06 2000-12-06 Method for universal coding of product characteristics, comprises attribution of unique codes to product and to product characteristics independantly of language and construction of a coding tree Withdrawn FR2817638A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR0015788A FR2817638A1 (en) 2000-12-06 2000-12-06 Method for universal coding of product characteristics, comprises attribution of unique codes to product and to product characteristics independantly of language and construction of a coding tree

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0015788A FR2817638A1 (en) 2000-12-06 2000-12-06 Method for universal coding of product characteristics, comprises attribution of unique codes to product and to product characteristics independantly of language and construction of a coding tree

Publications (1)

Publication Number Publication Date
FR2817638A1 true FR2817638A1 (en) 2002-06-07

Family

ID=8857280

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0015788A Withdrawn FR2817638A1 (en) 2000-12-06 2000-12-06 Method for universal coding of product characteristics, comprises attribution of unique codes to product and to product characteristics independantly of language and construction of a coding tree

Country Status (1)

Country Link
FR (1) FR2817638A1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6026333A (en) * 1997-06-10 2000-02-15 Fujitsu Limited Data utilizing system
US6026381A (en) * 1996-11-05 2000-02-15 Itx Corporation Financial market classification system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6026381A (en) * 1996-11-05 2000-02-15 Itx Corporation Financial market classification system
US6026333A (en) * 1997-06-10 2000-02-15 Fujitsu Limited Data utilizing system

Similar Documents

Publication Publication Date Title
CN106663124B (en) Generating and using knowledge-enhanced models
US10496749B2 (en) Unified semantics-focused language processing and zero base knowledge building system
Habernal et al. SWSNL: semantic web search using natural language
US10740398B2 (en) Structuring incoherent nodes by superimposing on a base knowledge graph
US10289717B2 (en) Semantic search apparatus and method using mobile terminal
US9104979B2 (en) Entity recognition using probabilities for out-of-collection data
US20180158078A1 (en) Computer device and method for predicting market demand of commodities
US9400835B2 (en) Weighting metric for visual search of entity-relationship databases
JP6478734B2 (en) Item recommendation device, item recommendation method and program
US20240184777A1 (en) Method and system for data conversations
US9400826B2 (en) Method and system for aggregate content modeling
CN112069326B (en) Knowledge graph construction method and device, electronic equipment and storage medium
CN109840255A (en) Reply document creation method, device, equipment and storage medium
KR102442422B1 (en) Knowledge Completion Method and Apparatus Using Query and Knowledge Graph Relationship Learning
CN109408643B (en) Fund similarity calculation method, system, computer equipment and storage medium
CN110110218B (en) Identity association method and terminal
CN111158692A (en) Method, system and storage medium for ordering similarity of intelligent contract functions
CN105354339B (en) Content personalization providing method based on context
CN112527963B (en) Dictionary-based multi-label emotion classification method and device, equipment and storage medium
CN112685452A (en) Enterprise case retrieval method, device, equipment and storage medium
FR2853972A1 (en) METHOD FOR GENERATING AN APPLICATION PROGRAM INTERFACE FOR INFORMATION BASED ON A RESOURCE DESCRIPTION FRAMEWORK (RDF)
Nedumov et al. Automation of data normalization for implementing master data management systems
US20220365976A1 (en) Identifying Objects Based On Free-Form Text Description
Blandfort et al. Image captioning in the wild: how people caption images on Flickr
FR2817638A1 (en) Method for universal coding of product characteristics, comprises attribution of unique codes to product and to product characteristics independantly of language and construction of a coding tree

Legal Events

Date Code Title Description
ST Notification of lapse