WO2009044087A1 - Installation de gestion d'une base de données - Google Patents

Installation de gestion d'une base de données Download PDF

Info

Publication number
WO2009044087A1
WO2009044087A1 PCT/FR2008/051627 FR2008051627W WO2009044087A1 WO 2009044087 A1 WO2009044087 A1 WO 2009044087A1 FR 2008051627 W FR2008051627 W FR 2008051627W WO 2009044087 A1 WO2009044087 A1 WO 2009044087A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
database
hierarchical
query
hierarchy
Prior art date
Application number
PCT/FR2008/051627
Other languages
English (en)
Inventor
Marc Vogel
Dan Vogel
Original Assignee
Marc Vogel
Dan Vogel
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Marc Vogel, Dan Vogel filed Critical Marc Vogel
Priority to EP08835732.2A priority Critical patent/EP2188744B1/fr
Priority to CA2699644A priority patent/CA2699644C/fr
Priority to US12/677,674 priority patent/US10509787B2/en
Publication of WO2009044087A1 publication Critical patent/WO2009044087A1/fr

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24561Intermediate data storage techniques for performance improvement

Definitions

  • the present invention relates to a database management interrogation installation comprising: a / a database comprising: a / means for filtering the data contained in fields from internal optimization algorithms; database adapted to provide the searched data in response to a query defining the filter; and a2 / at least one hierarchy of data of at least three hierarchical levels and b / interrogation means capable of providing at least one request defining a filter allowing the selection of the searched data by implementation of the filtering means.
  • databases are used to store a very large amount of data from multiple sources. It is known that these data are stored in tables each having several fields, these tables being defined by the data model. Relationships are established and stored in the database between the fields of the different tables.
  • Relational databases unlike multidimensional databases, do not offer standard objects to directly represent hierarchies.
  • a hierarchy or dimension substantially equivalent terms in the world of multidimensional databases, makes it possible to represent dependencies of elements on several hierarchical levels. For example, in a hierarchy of geographical type, at the first level are the continents, then the countries, then the cities. Thus, the city Paris is at the third level, the second and first being respectively France and Europe.
  • Such a hierarchy is commonly represented in the form of a tree whose child nodes are hierarchically at a lower level than the parent nodes on which they depend.
  • This first approach consists of representing the hierarchy as well as the sales list in a multidimensional database.
  • multidimensional databases are typically complex to implement and do not have some features that only exist in the world of relational databases. This loss can become a great disadvantage because it implies a strong structural choice with consequences in terms of functions, performance, costs, if the need to manage multi-level structures is only punctual and does not constitute first purpose of the product.
  • a variation of this approach is to use Online Analytical Processing (OLAP) connectors to query a relational database with multidimensional queries.
  • OLAP Online Analytical Processing
  • the disadvantages are that OLAP connectors are not available for all relational database engines and their performance is reduced because they have to go through data rework steps to perform multidimensional analysis. * Relational database approach with the data model typically used.
  • the second approach is to represent the hierarchy as well as the sales list in a classic relational database.
  • the latter is only used for storage. All the filtering work is done by an algorithm specialized in the computer program that processes these data. This algorithm is not implemented by the database engine.
  • This approach has the disadvantage of recovering all the data or multiplying the number of requests to the database and thus reducing the performance. In the case of a list of sales in Europe, it is necessary to recover the data of all the cities even those outside Europe to then filter those which are sought or to multiply the number of requests as exposed later.
  • the structure of the table representing the hierarchy is the most compact structure that can be used to represent a hierarchy but it does not allow the database alone, that is to say using only an SQL query, to answer a simple question such as "what are the cities in Europe? ".
  • the object of the invention is therefore to allow a hierarchical data processing in a relational database that does not require additional complex software tools and which can enable fast and hierarchical data filtering in a single SQL query.
  • the subject of the invention is an installation of the aforementioned type, characterized in that it comprises means for representing a hierarchy table comprising, for each hierarchical data, the set of data of which it is dependent, whatever the number of hierarchical levels separating them, each of the data of which it is dependent being contained in a separate record of the table containing in addition the hierarchical data item; and in that during a query from a query on hierarchical data, the filter means of the database are adapted to provide a response to the query formulated from the hierarchy table without recourse to multidimensional database query tools external to the database.
  • the problem is thus solved in a powerful way by taking advantage of the mechanisms of optimization of the database engine (indexes, hash tables, search in parallel, etc.).
  • the solution is thus provided by representing the hierarchy in a table of the traditional relational database in a format such that the database is itself able to filter the data using its own internal optimization algorithms and this on the based on a simple SQL query.
  • the installation comprises one or more of the following features:
  • the filtering means of the database comprise stored procedures and / or parameterized queries; the filtering means are capable of providing the data sought in response to a query made in the SQL language, the database is a relational database in which at least one table contains relations between the fields of the different tables,
  • the filtering means comprise means for indexing the hierarchy table; the filtering means of the database are adapted to provide a response to the request formulated from the only tables contained in the database and the table; hierarchy,
  • the hierarchy table comprises, for each record, a kinship degree indicator representative of the difference between the hierarchical level of the hierarchical data and the level of the hierarchical data on which it is dependent,
  • the hierarchy table comprises, for each hierarchical data item, a record whose parent degree indicator is zero and in which the hierarchical data and the hierarchical data item on which it is dependent are identical,
  • the hierarchy table comprises, for each record, a hierarchical depth level indicator representative of the difference between the hierarchical level of the hierarchical data item and the highest level of the hierarchical data on which it is dependent, and
  • FIG. 1 is a schematic view of a database management installation according to the invention
  • - Figure 2 is an illustration of a tree showing the organization of an example of hierarchical data.
  • FIG. 1 is illustrated a relational database management installation 10 including including hierarchical data. It comprises a relational database 12 comprising a set of tables 14A, 14B, 14C, for example three in number and a database management engine 16.
  • the database management engine 16 comprises, as known per se, means for filtering the data contained in the table fields from internal relational database optimization algorithms that can provide the desired data in the database. response to a query defining the filter.
  • the queries are SQL queries.
  • the management engine 16 is formed for example of a server implementing a suitable software such as Microsoft SqI Server, Oracle, MySQL, etc.
  • the database management engine includes stored procedures and / or parameterized queries, that is to say queries with parameters already pre-compiled, of which only certain parameters are modified. These stored procedures and / or parameterized queries are likely to be performed quickly given their nature.
  • the installation further comprises means 18 for interrogating the database formed by means 20 for entering at least one request defining a filter for selecting the desired data.
  • interrogation means 18 are formed for example of a computer implementing adapted software applications and connected to the server 16.
  • This software is for example a sales management tool, a securities management software and participations, software representation of hierarchies of people, products, etc.
  • the interrogation means 18 comprise in the application software means 18A for generating a hierarchy table 14C having a specific structure specified later.
  • This hierarchy table 14C describes in a particular format and redundant hierarchies between the data.
  • the software module constituting these interrogation means is able to provide the hierarchy table from the hierarchical data on which the processing is carried and to modify this table with each modification of the hierarchical data.
  • the interrogation means 18 furthermore comprise a software module for querying the database 12 based on SQL queries implemented by the engine 16.
  • This module is designated by the SQL querer. This module is suitable for formulating requests in the SQL format and for sending them to the server 16 so that it extracts from the relational database 12 the searched data corresponding to the requests.
  • the input means 20 consist for example of a keyboard and a query editor for the formulation of SQL queries in a predefined format.
  • the means 18 comprise a module 22 for providing the data collected in response to the SQL queries formulated. This is for example a display screen of the computer or means for saving the extracted data.
  • the tables of the database include, for example, a sales table 14A comprising two fields, namely an identifier representing a place of sale, in particular a city, and a sales amount associated with the point of sale.
  • This table 14A is for example in the following form:
  • Another table 14B contains a description of the places of sale (identifier, wording, address, inhabitants) without taking into account their position in the hierarchy of geographical entities.
  • this table 14B comprises, for example, four fields formed:
  • This table 14B is for example in the following form.
  • FIG. 2 The hierarchical data are represented in the form of a tree as illustrated in FIG. 2, in which each datum corresponds to a node of the tree.
  • the data are thus each associated with a hierarchical level which defines the depth of a datum relative to the root of the tree.
  • the level is indicated in the right part of the tree.
  • the arrows are oriented in the direction of hierarchical levels growing conventionally from parent to son.
  • a first datum of the tree is said to be dependent on a second datum if either this second datum is its father or if its father is dependent on this second datum.
  • the number of hierarchical levels separating them represents the degree of relationship.
  • Each data item of this tree is translated in the hierarchy table 14C by several records, with a record for each dependency that exists with another data item of the tree.
  • the hierarchy table 14C contains for each node of the hierarchy which other nodes are its direct or indirect parents. More precisely, for all hierarchical data, a record is contained in the table for each data item on which it is dependent. Each record contains the hierarchical data and the data on which it is dependent.
  • the hierarchy table 14C thus preferably contains four fields respectively corresponding to: - an identifier of the place of sale;
  • a degree of relationship that is to say the difference between the hierarchical level of the hierarchical data and the level of the hierarchical data on which it is dependent; an identifier of the hierarchical data whose data depends, this possibly in order to further simplify certain SQL queries and to offer even better performance; and
  • a hierarchical depth level "depth” representative of the difference between the hierarchical level of the hierarchical data, and the highest level of the hierarchical data on which it is dependent.
  • the degree of kinship corresponds to the distance in terms of generation between the elements of columns 1 and 3.
  • the records with degree 0 of kinship are such that columns 1 and 3 are identical.
  • each node is thus coupled in this example to up to three of its parent nodes.
  • the hierarchy table is necessarily large: the number of records is increased by the value n * d with n the number of nodes and the maximum depth.
  • n the number of nodes and the maximum depth.
  • this is not very constraining given the observed gain and since the factor that makes you fat is "d" and empirically for most hierarchies observed, it very rarely exceeds the value of 10 and the The order of magnitude of 'n' (for example, number of countries) rarely exceeds thousands.
  • a hierarchy of 1000 data and maximum depths 10 can never exceed 10000 records.
  • the request is made in a single pass, and the developer does not have to merge the results of multiple requests;
  • this data model makes it possible to manage any number of levels in a hierarchy with branches of different depths; and - An optimization of access to the database can be simply obtained through the addition of indexed on one or more fields of the 14C table.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

L'installation (10) de gestion d'une base de données comporte a/ une base de données (12) comprenant : a1/ des moyens (16) de filtrage des données contenues dans des champs à partir d'algorithmes internes d'optimisation de la base de données propres à fournir les données recherchées en réponse à une requête définissant le filtre; a2/ au moins une hiérarchie de données de au moins trois niveaux hiérarchiques; b/ des moyens (18) d'interrogation propres à fournir au moins une requête définissant un filtre permettant la sélection des données recherchées par mise en œuvre des moyens de filtrage (16). Elle comporte des moyens pour représenter une table de hiérarchie (14C) comprenant, pour chaque donnée hiérarchisée, l'ensemble des données dont elle est dépendante, quel que soit le nombre de niveaux hiérarchiques les séparant, chacune des données dont elle est dépendante étant contenue dans un enregistrement séparé de la table contenant en outre la donnée hiérarchisée; et en ce que lors d'une interrogation à partir d'une requête portant sur des données hiérarchisées, les moyens (16) de filtrage de la base de données sont adaptés pour fournir une réponse à la requête formulée à partir de la table de hiérarchie (14C) sans recours à des outils d'interrogation multidimensionnelle de la base de données extérieurs à la base de données.

Description

Installation de gestion d'une base de données
La présente invention concerne une installation d'interrogation de gestion d'une base de données comportant : a/ une base de données comprenant : ai/ des moyens de filtrage des données contenues dans des champs à partir d'algorithmes internes d'optimisation de la base de données propres à fournir les données recherchées en réponse à une requête définissant le filtre ; et a2/ au moins une hiérarchie de données de au moins trois niveaux hiérarchiques et b/ des moyens d'interrogation propres à fournir au moins une requête définissant un filtre permettant la sélection des données recherchées par mise en œuvre des moyens de filtrage.
De nos jours, les bases de données sont utilisées pour stocker un très grand nombre de données issues de sources multiples. Il est connu que ces don- nées soient stockées dans des tables comportant chacune plusieurs champs, ces tables étant définies par le modèle de données. Des relations sont établies et mémorisées dans la base de données entre les champs des différentes tables.
Les bases de données relationnelles contrairement aux bases de données multidimensionnelles n'offrent pas d'objets standard pour représenter directement des hiérarchies. Une hiérarchie ou dimension, termes sensiblement équivalents dans le monde des bases de données multidimensionnelles, permet de représenter des dépendances d'éléments sur plusieurs niveaux hiérarchiques. Par exemple, dans une hiérarchie de type géographique, au premier niveau se trouvent les continents, ensuite les pays, puis les villes. Ainsi, la ville Paris se trouve au troisième niveau, les second et premier étant respectivement France et Europe.
Une telle hiérarchie est couramment représentée sous la forme d'un arbre dont les nœuds fils sont hiérarchiquement à un niveau inférieur aux nœuds parents dont ils dépendent.
L'intérêt d'introduire le concept de hiérarchie dans une base de données est de pouvoir effectuer des changements d'échelle. Par exemple si la base de données relationnelles contient une liste des ventes d'un produit par ville du monde entier, il peut être intéressant de filtrer, de cette liste, toutes les ventes associées à une région du monde en particulier, par exemple l'Europe. Dans l'état de la technique, plusieurs approches sont connues pour traiter ce sujet de la gestion des hiérarchies. Elles peuvent être résumées comme suit. *Approche par une base multidimensionnelle
Cette première approche consiste à représenter la hiérarchie ainsi que la liste des ventes dans une base de données multidimensionnelles. Cependant, les bases de données multidimensionnelles sont en général complexes à mettre en œuvre et elles ne présentent pas certaines fonctionnalités qui n'existent que dans le monde des bases de données relationnelles. Cette perte peut devenir un grand inconvénient car il implique un choix structurel fort ayant des conséquences en ter- mes de fonctions, de performances, de coûts, si le besoin de gérer des structures à plusieurs niveaux n'est que ponctuel et ne constitue pas la finalité première du produit.
Une variante de cette approche consiste à utiliser des connecteurs OLAP ( Online Analytical Processing) qui permettent d'interroger une base de données relationnelles avec des requêtes multidimensionnelles. Les inconvénients sont que les connecteurs OLAP ne sont pas disponibles pour tous les moteurs de base de données relationnelles et que leur performance est réduite du fait qu'ils doivent passer par des étapes de retravail des données pour effectuer des analyses multidimensionnelles. * Approche bases de données relationnelles avec le modèle de données typiquement utilisé.
La deuxième approche consiste à représenter la hiérarchie ainsi que la liste de ventes dans une base de données relationnelles classique. Toutefois, cette dernière ne sert que pour le stockage. Tout le travail de filtrage est réalisé par un al- gorithme spécialisé par le programme informatique qui traite ces données. Cet algorithme n'est pas mis en œuvre par le moteur de la base de données. Cette approche présente l'inconvénient de récupérer l'intégralité des données ou de multiplier le nombre de requêtes vers la base de données et donc de réduire les performances. Dans le cas d'une liste de ventes en Europe, il convient de récupérer les données de toutes les villes même celles hors d'Europe pour ensuite filtrer celles qui sont recherchées ou de multiplier le nombre de requêtes comme exposé plus loin.
Le modèle de données pour les deux tables est alors par exemple le suivant : Table représentant la hiérarchie
Figure imgf000005_0001
Table représentant les ventes
Figure imgf000005_0002
La structure de la table représentant la hiérarchie est la structure la plus compacte qu'on puisse utiliser pour représenter une hiérarchie mais elle ne permet pas à la seule base de données, c'est-à-dire en utilisant seulement une requête SQL, de répondre à une question simple telle que « quelles sont les villes en Europe ? ».
En effet, beaucoup de traitements doivent être réalisés directement dans l'application pour compenser les limites de la base de données. Par exemple, une approche pour répondre à la question ci-dessus consiste en multipliant les requêtes dans la base de données à déterminer à l'avance tous les pays présents en Europe et puis ensuite à déterminer toutes les villes existant en France et en Allemagne (ici Paris, Lyon puis Berlin). Ensuite un premier choix consiste à effectuer plusieurs requêtes du type ("quelles sont les ventes sur Paris ?", "quelles sont les ventes sur Lyon ?" et "quelles sont les ventes sur Berlin?") pour extraire les ventes associées à chaque ville. La contrepartie est que les performances peuvent rapidement se dégrader si le nombre de villes se compte en centaines ou en milliers. Ensuite, la complexité du code source en souffrira, notamment en fusionnant les résultats et/ou éventuellement en réordonnant si l'on souhaite avoir les ventes par montants croissants. Pour éviter de multiplier les requêtes on peut également construire une requête unique impliquant des opérateurs « IN » et « OR » utilisés pour filtrer sur toutes les villes qui ont été identifiées précédemment. Cependant, cela présente les inconvénients suivants : * certains moteurs de base de données ont des limites sur le nombre de caractères maximal autorisés pour des requêtes SQL. La requêtes SQL pouvant grandir rapidement ici si le nombre de villes concernées dépasse les milliers.
* certains moteurs de base de données ont des limites quant au nombre d'opérateurs « OR » autorisés dans une requête. Par ailleurs multiplier le nombre d'opérateurs « OR » dégrade les performances.
* certains moteurs de base de données ont des limites quant au nombre d'éléments pouvant être inclus dans une clause « IN». Par ailleurs multiplier le nombre d'éléments dans une clause « IN » dégrade les performances. * du fait que la requête SQL est générée dynamiquement, il devient impossible d'utiliser les requêtes « SQL à paramètres pré compilées » ou « des procédures stockées » et donc de bénéficier des grands gains de performances associés. Une autre alternative consiste à réaliser une jointure de la table qui contient la hiérarchie avec elle-même et de répéter ces jointures autant de fois que la donnée recherchée est éloignée du sommet de la hiérarchie. Cette alternative présente les inconvénients suivants :
• le nombre de jointures qui peuvent être réalisées dans le cadre d'une même requête est souvent limité par la base de données limitant dès lors le nombre de niveaux maximum d'une hiérarchie • les jointures sont des opérations complexes, les multiplier en grand nombre dégrade les performances
• récriture de la requête peut se révéler très complexe (multiplication du nombre de jointures) et son traitement très lourd si dans la même requête, les données recherchées ont des niveaux hiérarchiques différents. • du fait que le nombre de jointure à effectuer n'est pas connu à l'avance car il dépend du niveau hiérarchique de la données recherchée, il n'est pas possible d'utiliser ici aussi les requêtes SQL à « paramètres pré compilé » ou « procédures stockées ».
L'invention a donc pour but de permettre un traitement de données hiérarchisée dans une base de données relationnelles qui ne nécessite pas d'outils logiciels complexes supplémentaires et qui puisse permettre un filtrage rapide et sur des données hiérarchisées et ce en une seule requête SQL. A cet effet, l'invention a pour objet une installation du type précité, caractérisée en ce qu'elle comporte des moyens pour représenter une table de hiérarchie comprenant, pour chaque donnée hiérarchisée, l'ensemble des données dont elle est dépendante, quel que soit le nombre de niveaux hiérarchiques les séparant, chacune des données dont elle est dépendante étant contenue dans un enregistrement sépa- ré de la table contenant en outre la donnée hiérarchisée ; et en ce que lors d'une interrogation à partir d'une requête portant sur des données hiérarchisées, les moyens de filtrage de la base de données sont adaptés pour fournir une réponse à la requête formulée à partir de la table de hiérarchie sans recours à des outils d'interrogation multidimensionnelle de la base de données extérieurs à la base de données.
Le problème est ainsi résolu de manière performante en tirant partie des mécanismes d'optimisation du moteur de base de données (indexes, « hash tables », recherche en parallèles, etc .).
La solution est ainsi apportée en représentant la hiérarchie dans une table de la base de données relationnelles classique dans un format tel que la base de données soit capable elle-même de filtrer les données en utilisant ses propres algorithmes d'optimisation interne et ce sur la base d'une simple requête SQL.
Suivant des modes particuliers de réalisation, l'installation comporte l'une ou plusieurs des caractéristiques suivantes :
- les moyens de filtrage de la base de données comportent des procédures stockées et/ou des requêtes paramétrées, - les moyens de filtrage sont propres à fournir les données recherchées en réponse à une requête faite en langage SQL, - la base de données est une base de données relationnelle dont au moins une table contient des relations entre les champs des tables différentes,
- les moyens de filtrage comportent des moyens d'indexation de la table de hiérarchie, - les moyens de filtrage de la base de données sont adaptés pour fournir une réponse à la requête formulée à partir des seules tables contenues dans la base et de la table de hiérarchie,
- la table de hiérarchie comprend, pour chaque enregistrement, un indicateur de degré de parenté représentatif de l'écart entre le niveau hiérarchique de la don- née hiérarchisée et le niveau de la donnée hiérarchisée dont elle est dépendante,
- la table de hiérarchie comprend, pour chaque donnée hiérarchisée, un enregistrement, dont l'indicateur de degré de parenté est nul et dans lequel la donnée hiérarchisée et la donnée hiérarchisée dont elle est dépendante sont identiques,
- la table de hiérarchie comprend, pour chaque enregistrement, un indicateur de niveau de profondeur hiérarchique représentatif de l'écart entre le niveau hiérarchique de la donnée hiérarchisée et le niveau le plus élevé des données hiérarchisées dont elle est dépendante, et
- elle comporte au moins une table qui décrit au moins certaines des données hiérarchisées. L'invention sera mieux comprise à la lecture de la description qui va suivre, donnée uniquement à titre d'exemple et faite en se référant aux dessins, sur lesquels :
- la figure 1 est une vue schématique d'une installation de gestion de base de données selon l'invention ; et - la figure 2 est une illustration d'un arbre montrant l'organisation d'un exemple de données hiérarchisées.
Sur la figure 1 est illustrée une installation 10 de gestion de base de données relationnelles comportant notamment des données hiérarchisées. Elle comporte une base de données relationnelles 12 comprenant un ensemble de tables 14A, 14B, 14C, par exemple au nombre de trois et un moteur 16 de gestion de base de données.
Chaque table comporte un ensemble de champs. Certains champs des différentes tables sont reliés entre eux par des relations. Le moteur 16 de gestion de base de données comprend, comme connu en soi, des moyens de filtrage des données contenues dans les champs des tables à partir d'algorithmes internes d'optimisation de la base de données relationnelles propres à fournir les données recherchées en réponse à une requête définissant le filtre. Dans le mode réalisation envisagé, les requêtes sont des requêtes SQL. Le moteur de gestion 16 est formé par exemple d'un serveur mettant en œuvre un logiciel adapté tel que Microsoft SqI Server, Oracle, MySQL, etc..
Le moteur de gestion de base de données comporte des procédures stockées et/ou des requêtes paramétrées, c'est-à-dire des requêtes à paramètres déjà pré-compilées dont seuls certains paramètres sont modifiés. Ces procédures stockées et/ou des requêtes paramétrées sont susceptibles d'être effectuées rapidement compte tenu de leur nature.
L'installation comprend en outre des moyens 18 d'interrogation de la base de données formés de moyens 20 de saisie d'au moins une requête définissant un filtre permettant la sélection des données recherchées.
Ces moyens d'interrogation 18 sont formés par exemple d'un ordinateur mettant en œuvre des logiciels applicatifs adaptés et relié au serveur 16. Ce logiciel est par exemple un outil de gestion des ventes, un logiciel de gestion de titres et participations, un logiciel de représentation de hiérarchies de personnes, de produits, etc..
Les moyens d'interrogation 18 comportent dans le logiciel applicatif des moyens 18A de génération d'une table de hiérarchie 14C ayant une structure spécifique précisée ultérieurement. Cette table de hiérarchie 14C décrit sous un format particulier et redondant les hiérarchies entre les données. Le module logiciel consti- tuant ces moyens d'interrogation est propre à fournir la table de hiérarchie à partir des données hiérarchisées sur lesquelles portent les traitements et à modifier cette table à chaque modification des données hiérarchisées.
Les moyens d'interrogation 18 comportent en outre un module logiciel d'interrogation de la base 12 à partir de requêtes SQL mises en œuvre par le moteur 16. Ce module est désigné par requêteur SQL. Ce module est propre à formuler des requêtes au format SQL et à les adresser au serveur 16 pour qu'il extraie de la base de données relationnelles 12 les données recherchées correspondant aux requêtes. Les moyens de saisie 20 constitués par exemple d'un clavier et d'un éditeur de requête permettant la formulation de requêtes SQL suivant un format prédéfini.
Enfin, les moyens 18 comportent un module 22 de mise à disposition des données recueillies en réponse aux requêtes SQL formulées. Il s'agit par exemple d'un écran d'affichage de l'ordinateur ou de moyens de sauvegarde des données extraites.
Les tables de la base de données comprennent par exemple une table 14A des ventes comprenant deux champs à savoir un Identifiant représentant un lieu de vente, notamment une ville, et un montant de ventes associé au lieu de vente.
Cette table 14A est par exemple sous la forme suivante :
Table des Ventes
Figure imgf000010_0001
En outre, une autre table 14B renferme une description des lieux de vente (identifiant, libellé, adresse, habitants) sans tenir de leur position dans la hiérarchie des entités géographiques.
Ainsi, cette table 14B comporte par exemple, quatre champs formés :
- d'un identifiant numérique de chaque lieu de vente
- d'un libellé comportant le nom du lieu de vente - d'une adresse du magasin du lieu de vente, et
- du nombre d'habitants du lieu de vente.
Cette table 14B est par exemple sous la forme suivante.
Table des Entités de la hiérarchie
Figure imgf000010_0002
Figure imgf000011_0001
Enfin, une autre table 14 C, représente un arbre tel que décrit ci-dessous : Les données hiérarchisées sont représentées sous la forme d'un arbre tel qu'illustré sur la figure 2, dans lequel chaque donnée correspond à un nœud de l'arbre. Les données sont ainsi chacune associées à un niveau hiérarchique qui définit la profondeur d'une donnée par rapport à la racine de l'arbre. Le niveau est indiqué dans la partie droite de l'arbre. Les flèches sont orientées dans le sens des niveaux hiérarchiques croissants par convention du parent vers les fils. Une première donnée de l'arbre est dite dépendante d'une seconde donnée si soit cette deuxième donnée est son père soit si son père est dépendante de cette deuxième donnée. Lorsque deux données sont dépendantes le nombre de niveaux hiérarchiques les séparant représente le degré de parenté.
Chaque donnée de cet arbre est traduite dans la table 14C de hiérarchie par plusieurs enregistrements, avec un enregistrement pour chaque dépendance qui existe avec une autre donnée de l'arbre.
En d'autres termes, la table de hiérarchie 14C contient pour chaque nœud de la hiérarchie quels autres nœuds sont ses parents directs ou indirects. Plus précisément, pour toutes les données hiérarchisées, un enregistrement est contenu dans la table pour chaque donnée dont elle est dépendante. Chaque enregistrement contient la donnée hiérarchisée et la donnée dont elle est dépendante.
La table de hiérarchie 14C contient ainsi de préférence quatre champs correspondants respectivement à : - un identifiant du lieu de vente ;
- un degré de parenté, c'est-à-dire l'écart entre le niveau hiérarchique de la donnée hiérarchisée et le niveau de la donnée hiérarchisée dont elle est dépendante ; - un identifiant de la donnée hiérarchisée dont la donnée dépend, ceci é- ventuellement afin de simplifier davantage certains requêtes SQL et d'offrir encore de meilleures performance ; et
- un niveau de profondeur hiérarchique "profondeur" représentatif de l'écart entre le niveau hiérarchique de la donnée hiérarchisée, et le niveau le plus élevé des données hiérarchisées dont elle est dépendante.
Figure imgf000012_0001
Figure imgf000013_0001
Le degré de parenté correspond à la distance en terme de génération entre les éléments des colonnes 1 et 3. Les enregistrements avec le degré 0 de parenté sont tels que les colonnes 1 et 3 sont identiques. Dans cet exemple, chaque nœud est ainsi couplé dans cet exemple à jusqu'à trois de ses nœuds parents.
A partir d'une simple requête SQL, il est possible d'exploiter la hiérarchie entre les données. En effet, une unique requête SQL suffit pour exploiter la hiérarchie puisqu'elle recourt alors au seul moteur de données 16 qui comporte des algorithmes optimisés propres de recherche dans la base de données relationnelles (indexes, « hash tables », recherche en parallèles, etc .). En outre, comme exposé dans les exemples présentés plus loin, la structure de la requêtes SQL ne dépend du nombre de données à extraire, il est également possible de tirer de procédures stockées ou requêtes SQL pré compilées afin d'obtenir des gains de performance supplémentaires.
On pourrait craindre que dans un tel modèle de données, la table des hiérarchies soit nécessairement de grande taille : le nombre d'enregistrements étant majoré par la valeur n*d avec n le nombre de nœuds et d la profondeur maximale. Cependant, cela n'est pas très contraignant compte tenu du gain observé et dans la mesure où le facteur qui fait grossir est « d » et empiriquement dans le cas de la plupart des hiérarchies observées, il dépasse très rarement la valeur de 10 et l'ordre de grandeur de « n » (par exemple nombre de pays) dépasse rarement les milliers. Ainsi une hiérarchie de 1000 données et de profondeurs maximum 10, ne pourra jamais dépasser 10000 enregistrements.
Il est alors possible simplement de répondre aux questions suivantes à partir de simples requêtes SQL. - quel est le grand-père (Continent) de la ville Paris (ld=4)?
SELECT Parent FROM Nœuds WHERE Degré=2 AND ldentifiant=4 Cette requête renvoie : Europe
- quels sont tous les éléments (Continent+Pays+Villes) contenus en Europe (ld=1 ) ? SELECT Identifiant FROM Nœuds WHERE Parent=1
Cette requête renvoie : Europe, France, Allemagne, Paris, Berlin, Lyon
- quels sont les villes contenues en Europe (ld=1 ) ?
SELECT Identifiant FROM Nœuds WHERE Parent=1 AND Degré=2 La partie « degré=2 » permet de se débarrasser des éléments du type Pays et de ne garder que les Villes
Cette requête renvoie : Paris, Lyon, Berlin
- quelle est la liste des ventes réalisées en Europe (ld=1 ) ? SELECT Ventes. Identifiant, Ventes. Montant FROM Nœuds, Ventes
WHERE Ventes. ldentifiant=Nœuds. Identifiant AND Nœuds. Parent=1 AND Nœuds. Deg ré=2
Cette requête renvoie : 4 (=Paris),3 et 6 (=l_yon), 4 et 5 (≈Berlin), 7
- quelle est la liste des ventes réalisées en Europe (ld=1 ) et à NewYork (Id=IO) ? SELECT Ventes. Identifiant, Ventes. Montant FROM Nœuds, Ventes
WHERE Ventes. ldentifiant=Nœuds. Identifiant AND Nœuds. Parent IN (1 ,10) AND Nœuds. Degré=2
Cette requête illustre qu'il est possible avec grande facilité, c'est-à-dire sans rajouter de jointures supplémentaires ou de complexifier la requête de réaliser en même temps des interrogations sur des données situés à des niveaux hiérarchiques différents (ici Europe et New York)
- quelle est la somme des ventes réalisées en Europe (ld=1 ) ? SELECT SUM(Ventes. Montant) FROM Nœuds, Ventes WHERE Ventes. ldentifiant=Nœuds. Identifiant AND Nœuds. Parent=1 AND Nœuds. Degré=2
Du fait de l'utilisation seulement d'une base de données relationnelles, il est possible de réaliser facilement des jointures dans la même requête SQL pour récupérer des valeurs provenant d'autres tables ou pour poser des questions portant sur des critères extérieurs. Il est ainsi possible de répondre aux questions suivantes :
- quelle est la liste (avec adresse) des ventes réalisées en Europe (ld=1 ) ? SELECT Entités.Adresse, Ventes. Identifiant, Ventes. Montant FROM
Nœuds,Ventes, Entités WHERE Ventes. ldentifiant=Nœuds. Identifiant AND Nœuds. P arent=1 AND Nœuds. Degré=2 AND Entités. ldentifiant=Nœuds. Identifiant
- quelle est la liste (avec adresse) des ventes réalisées dans les villes d'Europe (ld=1 ) de plus de 3 millions d'habitants ?
SELECT Entités.Adresse, Ventes. Identifiant, Ventes. Montant FROM Nœuds, Ventes, Entités WHERE Ventes. ldentifiant=Nœuds. Identifiant AND Nœuds. Parent=1 AND Nœuds. Degré=2 AND Entités. ldentifiant=Nœuds. Identifiant AND Entités. Habitants>=3 000 000
II est à noter que pour permettre d'autres requêtes, il est avantageusement prévu dans la table des Nœuds une colonne "profondeur" qui contrairement à la colonne Degré permet des recherches portant sur la profondeur d'un élément par rapport au haut de la hiérarchie. Cette colonne permet de simplifier les requêtes SQL mais elle n'est pas indispensable car il est possible d'obtenir des résultats similaires par jointure supplémentaire.
Les autres avantages suivants sont obtenus :
- l'approche est utilisable pour toute base de données SQL car elle n'utilise pas de spécificité particulière ;
- la requête est réalisée en une seule passe, et le développeur n'a pas à fusionner les résultats de multiples requêtes ;
- ce modèle de données permet de gérer un nombre quelconque de niveaux dans une hiérarchie avec des branches de profondeurs différentes ; et - une optimisation des accès à la base données peut être simplement obtenue grâce à l'ajout d'indexés sur un plusieurs ou champs de la table 14C.

Claims

REVENDICATIONS
1.- Installation (10) de gestion d'une base de données comportant : a/ une base de données (12) comprenant : ai/ des moyens (16) de filtrage des données contenues dans des champs à partir d'algorithmes internes d'optimisation de la base de données propres à fournir les données recherchées en réponse à une requête définissant le filtre ; et a2/ au moins une hiérarchie de données de au moins trois niveaux hiérarchiques ; et b/ des moyens (18) d'interrogation propres à fournir au moins une requête dé- finissant un filtre permettant la sélection des données recherchées par mise en œuvre des moyens de filtrage (16); caractérisée en ce qu'elle comporte des moyens pour représenter une table de hiérarchie (14C) comprenant, pour chaque donnée hiérarchisée : l'ensemble des données dont elle est dépendante, quel que soit le nombre de niveaux hiérarchiques les séparant, chacune des données dont elle est dépendante étant contenue dans un enregistrement séparé de la table contenant en outre la donnée hiérarchisée ; et un indicateur de degré de parenté représentatif de l'écart entre le niveau hiérarchique de la donnée hiérarchisée et le niveau de chaque donnée hiérarchisée dont elle est dépendante et/ou un indicateur de niveau de profondeur hiérarchique représentatif de l'écart entre le niveau hiérarchique de la donnée hiérarchisée et le niveau le plus élevé des données hiérarchisées dont elle est dépendante, et en ce que lors d'une interrogation à partir d'une requête portant sur des données hiérarchisées, les moyens (16) de filtrage de la base de données sont adaptés pour fournir une réponse à la requête formulée à partir de la table de hiérarchie (14C) sans recours à des outils d'interrogation multidimensionnelle de la base de données extérieurs à la base de données.
2. Installation selon la revendication 1 , caractérisée en ce que le les moyens (16) de filtrage de la base de données comportent des procédures stockées et/ou des requêtes paramétrées.
3. Installation selon la revendication 1 ou 2, caractérisée en ce que les moyens de filtrage (16) sont propres à fournir les données recherchées en réponse à une requête faite en langage SQL.
4. Installation selon l'une quelconque des revendications précédentes, caractérisée en ce que la base de données est une base de données relationnelle dont au moins une table (14A, 14B) contient des relations entre les champs des tables différentes.
5. Installation selon la revendication 4, caractérisée en ce que les moyens (16) de filtrage comportent des moyens d'indexation de la table de hiérarchie (14C).
6. Installation l'une quelconque des revendications précédentes, caractérisée en ce que les moyens (16) de filtrage de la base de données sont adaptés pour fournir une réponse à la requête formulée à partir des seules tables (14A, 14B) conte- nues dans la base et de la table de hiérarchie (14C).
7. Installation selon la revendication 1 , caractérisée en ce que la table de hiérarchie (14C) comprend, pour chaque donnée hiérarchisée, un enregistrement, dont l'indicateur de degré de parenté est nul et dans lequel la donnée hiérarchisée et la donnée hiérarchisée dont elle est dépendante sont identiques.
8. Installation selon l'une quelconque des revendications précédentes, caractérisée en ce qu'elle comporte au moins une table (14B) qui décrit au moins certaines des données hiérarchisées.
PCT/FR2008/051627 2007-09-11 2008-09-11 Installation de gestion d'une base de données WO2009044087A1 (fr)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP08835732.2A EP2188744B1 (fr) 2007-09-11 2008-09-11 Installation de gestion d'une base de données
CA2699644A CA2699644C (fr) 2007-09-11 2008-09-11 Installation de gestion d'une base de donnees
US12/677,674 US10509787B2 (en) 2007-09-11 2008-09-11 Installation for managing a database

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0757498A FR2920898B1 (fr) 2007-09-11 2007-09-11 Installation de gestion d'une base de donnees
FR0757498 2007-09-11

Publications (1)

Publication Number Publication Date
WO2009044087A1 true WO2009044087A1 (fr) 2009-04-09

Family

ID=39171397

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2008/051627 WO2009044087A1 (fr) 2007-09-11 2008-09-11 Installation de gestion d'une base de données

Country Status (5)

Country Link
US (1) US10509787B2 (fr)
EP (1) EP2188744B1 (fr)
CA (1) CA2699644C (fr)
FR (1) FR2920898B1 (fr)
WO (1) WO2009044087A1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2365432A2 (fr) 2000-02-26 2011-09-14 Qualcomm Incorporated DSP avec processeur à double mac et coprocesseur à double mac

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8321435B2 (en) * 2009-08-12 2012-11-27 Apple Inc. Quick find for data fields
US20160299927A1 (en) * 2015-04-10 2016-10-13 Infotrax Systems Service oriented flat file system
US9916359B2 (en) 2015-06-01 2018-03-13 Sap Se Indexing dynamic hierarchical data
CN106604073B (zh) * 2015-10-14 2019-12-24 北京国双科技有限公司 一种数据处理方法及装置
US11763321B2 (en) 2018-09-07 2023-09-19 Moore And Gasperecz Global, Inc. Systems and methods for extracting requirements from regulatory content
US11170330B2 (en) 2019-12-13 2021-11-09 Safesite Solutions, Inc. Workplace risk determination and scoring system and method
US10956673B1 (en) 2020-09-10 2021-03-23 Moore & Gasperecz Global Inc. Method and system for identifying citations within regulatory content
US11314922B1 (en) 2020-11-27 2022-04-26 Moore & Gasperecz Global Inc. System and method for generating regulatory content requirement descriptions
US20220147814A1 (en) 2020-11-09 2022-05-12 Moore & Gasperecz Global Inc. Task specific processing of regulatory content
US11823477B1 (en) 2022-08-30 2023-11-21 Moore And Gasperecz Global, Inc. Method and system for extracting data from tables within regulatory content

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6480857B1 (en) * 2001-06-07 2002-11-12 David Chandler Method of organizing hierarchical data in a relational database
US20040122646A1 (en) * 2002-12-18 2004-06-24 International Business Machines Corporation System and method for automatically building an OLAP model in a relational database
US20070203892A1 (en) * 2006-02-27 2007-08-30 Business Objects, S.A. Apparatus and method for using vertical hierarchies in conjuction with hybrid slowly changing dimension tables

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6199062B1 (en) * 1998-11-19 2001-03-06 International Business Machines Corporation Reverse string indexing in a relational database for wildcard searching
EP1397757A2 (fr) 1999-12-20 2004-03-17 Acta Technology, Inc. Dispositif de restructuration de donnees pour hierarchies aplanissantes
US7895191B2 (en) * 2003-04-09 2011-02-22 International Business Machines Corporation Improving performance of database queries
US20070260582A1 (en) * 2006-05-05 2007-11-08 Inetsoft Technology Method and System for Visual Query Construction and Representation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6480857B1 (en) * 2001-06-07 2002-11-12 David Chandler Method of organizing hierarchical data in a relational database
US20040122646A1 (en) * 2002-12-18 2004-06-24 International Business Machines Corporation System and method for automatically building an OLAP model in a relational database
US20070203892A1 (en) * 2006-02-27 2007-08-30 Business Objects, S.A. Apparatus and method for using vertical hierarchies in conjuction with hybrid slowly changing dimension tables

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2365432A2 (fr) 2000-02-26 2011-09-14 Qualcomm Incorporated DSP avec processeur à double mac et coprocesseur à double mac

Also Published As

Publication number Publication date
FR2920898B1 (fr) 2010-07-30
EP2188744B1 (fr) 2019-03-13
CA2699644A1 (fr) 2009-04-09
CA2699644C (fr) 2017-08-29
FR2920898A1 (fr) 2009-03-13
US20100287164A1 (en) 2010-11-11
US10509787B2 (en) 2019-12-17
EP2188744A1 (fr) 2010-05-26

Similar Documents

Publication Publication Date Title
EP2188744B1 (fr) Installation de gestion d'une base de données
EP0593341B1 (fr) Procédé d'aide à l'optimisation d'une requête d'un système de gestion de base de données relationnel et procédé d'analyse syntaxique en résultant
FR2832236A1 (fr) Interface graphique de portail web semantique
WO2005045698A2 (fr) Procede mis en oeuvre dans un environnement informatique pour engendrer une vue courante a partir d’au moins un objet d’information source susceptible de varier
EP2188745B1 (fr) Procédé d'interrogation d'une base de données et dispositif d'interrogation
WO2001077889A9 (fr) Systeme de recherche et d'aide au choix
EP2367122A1 (fr) Procédé de structuration de données hierarchiques dans des bases de données relationnelles
CA2419377C (fr) Systeme d'interface d'acces aux donnees d'une base de donnees
FR2859801A1 (fr) Procede de traitement de donnees sur la base de structures dynamiques d'elements simples
EP1895410A1 (fr) Procédé et système d'extraction d'un tableau croisé d'une base de données, et produit programme d'ordinateur correspondant
FR2843640A1 (fr) Procede de generation, de transmission et de traitement de documents
EP1700233B1 (fr) Procede d'organisation d'une base de donnees
FR2917518A1 (fr) Procede de tri d'informations
FR3096157A1 (fr) procédé d’indexation multidimensionnelle de contenus textuels
WO2009115695A1 (fr) Procede d'enrichissement de sources de donnees
EP2738700A1 (fr) Procédé de génération automatique de requêtes SQL
WO2006061134A1 (fr) Procede de positionnement d’objets sur une interface
EP1408428A1 (fr) Système et procédé de traitement et de visualisation des résultats de recherches effectuées par un moteur de recherche à base d'indexation, modèle d'interface et méta-modèle correspondants
WO2011113829A1 (fr) Procedes multi-dimensionnels d'enregistrement et de recherche de documents
WO2007088254A1 (fr) Systeme d'information structure, relationnel et incremental
WO2015082593A1 (fr) Systeme informatique comportant une base de donnees memorisee sous la forme d'une table
WO2002029625A2 (fr) Procede de surveillance de ressources d'information sur un reseau
WO2001029703A1 (fr) Procede pour creer une structure hierarchique variable d'acces a des actions dans un systeme informatique
FR2973534A1 (fr) Procede d'optimisation de recherche sur des donnees accessibles par un service web

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 08835732

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2008835732

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2699644

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 12677674

Country of ref document: US