WO2011023876A2 - Procede pour organiser des variables dans une base de donnees - Google Patents
Procede pour organiser des variables dans une base de donnees Download PDFInfo
- Publication number
- WO2011023876A2 WO2011023876A2 PCT/FR2010/051632 FR2010051632W WO2011023876A2 WO 2011023876 A2 WO2011023876 A2 WO 2011023876A2 FR 2010051632 W FR2010051632 W FR 2010051632W WO 2011023876 A2 WO2011023876 A2 WO 2011023876A2
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- variables
- indicators
- group
- correlated
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
- G06F16/287—Visualization; Browsing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
Definitions
- the invention relates to decision support tools and the organization of variables in a database.
- all production is implemented through an information system that manages both the flows related to customer communications (voice, SMS, MMS, Internet, etc.).
- prospecting and marketing flows flows related to financial monitoring, flows related to quality of service monitoring, flows related to operational performance, etc. All these flows are listened to in real time by means of IT agents (such as robots) that collect all kinds of data, with more or less fine granularities depending on the needs of the analyzes (this usually goes from minute to hour).
- IT agents such as robots
- the capability analyst is able to read them.
- a person in charge of business intelligence wants to redefine objectives for activities within the company (which can be called business objectives for business chains) it is this analyst who gives him a possible reading of the indicators directly impacted by these new forecasts.
- the capacity analysis activity is similar to a surveillance that provides a reading of the state of the company's health, from sales made in real time within the agencies or via the Internet, to the set of network connections that must be provided to meet the demand.
- the capability analysis allows to establish contingency plans that are decision support tools: if an alert is given as to the functioning an application server, it is desirable to anticipate all future alerts and make the right decisions to prevent the crisis extends to all production.
- the information system is in perpetual evolution and it is difficult for the capability analyst to anticipate possible evolutions (deletion or addition of a server, decrease or increase of a set of connections, variation of the number of agency users, migration to new applications, etc.). Likewise, it is difficult for him to define the new agents that are then necessary for an optimal reading of all the indicators.
- KPIs key performance indicators
- the KPI repository is a tool whose design is reserved for business intelligence, which relies solely on the nomenclature of the business lines concerned.
- the capability analyst must constantly guarantee the support of the complex system according to the planning of the business objectives. Decision-making IT experts unknowingly make choices that influence the information system.
- capacity analysts are confronted with the complexity of the information system and poorly apprehend the relevant business chains from the observable technical indicators to the KPI itself. The analyst tends to consider that any remarkable similarity between two indicators implies a cause-and-effect relationship, which considerably distorts the capacity analyzes and the reports of business intelligence.
- indicators are often redundant or overloaded in a complex system that has become complicated, poorly observed and costly, thus severely reducing the return on investment.
- An object of the invention is therefore to improve the quality of decisions based on variables such as indicators.
- a method for organizing a database comprising variables, such as indicators, relating to a multi-state object, to each corresponding variable of the values associated with the respective states, method in which :
- the means form groups each consisting of one of the variables and others of the variables correlated with the latter and sufficient to deduce the latter;
- the means associate, in a database, with each of the variables of the group, a datum indicating at least one identity of the other variables of the group.
- the invention proceeds by relying on the truly observable correlations within the data field of the variables relating to the observed complex system. It ensures the correlation and significant codification of key variables within the capability analysis and enables a true mapping of the variables between them, while consolidating the integrity of the data within the data warehouse (authenticity and reliability). traceability).
- the method makes it possible to organize discrete and chaotic variables into a tree structure showing probable cause-and-effect relationships, from so-called elementary variables, to key variables.
- the invention allows a better understanding of the information system in real time. It makes it possible to automate contingency plans, monitoring operations and alert management.
- the invention allows a rapid reading of the impacts related to the forecasts (decision-making computer side) as well as to crises (on the project management side). Better than an impact study, the database obtained with the invention can be updated regularly to take into account the latest developments in the information system.
- the means construct a graph, such as a Petri net, of the group, for example by means of a rising algorithm.
- the graph encapsulates the identity of the key variable and the group to which it belongs.
- the means code the graph to produce the data.
- This code makes it possible to find quickly and easily the corresponding graph, and thus the identities of the variables and their relations.
- This significant coding of the variables reinforces the quality of the data within a data warehouse, in terms of integrity first (authenticity and traceability), but also in terms of completeness.
- This form of representation as a graph, combined with the significant codification, allows a subsequent processing, for example of hyperspherization or iconography, as well as queue type modeling.
- one of the variables is selected and a vector corresponding to the variable is placed;
- one of the variables is selected which is most closely correlated with those corresponding to a vector already positioned and a vector corresponding to this variable is placed at a position representing this correlation
- the vectors being positioned with their origin in the center of a sphere representing the object and their end on the sphere.
- This mode of representation makes it possible to evaluate the degree of relevance with regard to the object of the variables considered and the completeness of the supervision tool with respect to the observed complex system.
- automated means obtain in a database at least one datum indicating an identity of variables correlated with a predetermined variable and forming with it a group such that the variables of the group, except one, are sufficient to deduce the latter, the means thus identifying the correlated variables;
- the means exploit the identities of the identified variables, for example transmit them on a telecommunication network.
- the means identify, from the data, cause-effect relationships between the variables of the group.
- the means control the mention on a web page identities variables identified.
- a computer program which includes code instructions adapted to control the implementation of a method according to the invention when it is executed on a computer. It is also planned to make this program available on a telecommunication network for downloading, as well as a data recording medium comprising this program in recorded form.
- the invention also provides a device for organizing a database comprising variables, such as indicators, relating to a multi-state object, to each corresponding variable of the values associated with the respective states, the device comprising means capable of:
- a database which comprises:
- the invention can be employed with entities having needs in the areas of business intelligence or capability analysis. All industrial sectors are concerned by this invention: nuclear, transport, pharmaceutical, cosmetic, automotive, equipment manufacturers, energy, financial, insurance, etc. Indeed, whatever the field of application, it does not matter which names are given variables, since the specific requirements of the are respected and that a real-time reading is possible.
- the invention can thus be applied for example in the following fields:
- - nuclear inside temperature of a glove box, temperature of the hot material during machining, lubricant flow, thickness of the handling gloves, opening time of the portholes, exposure time of the technicians, etc.
- FIG. 1 is a flowchart illustrating the correspondence between a formal language and a family of trades
- FIG. 2 presents curves illustrating the superimposed connection between two indicators
- FIGS. 3 and 4 are Petri nets of a redundant character and an indicator link
- FIGS. 5 and 6 are respectively a matrix of connectivity and the stacking of the indicators relating thereto;
- FIG. 9 is the Petri net of a linear stack of elementary indicators within a chain
- FIGS. 10 and 11 show matrices in which the indicators are respectively redundant or overload one of the indicators
- FIGS. 12 to 14 are matrices respectively illustrating the initialization of the descriptive matrix in the method of the invention, the definition of the elementary zone and finally the general staircase shape;
- FIGS. 15 to 21 are matrices and Petri nets illustrating respectively a simple redundancy, a duplicate, a multiple redundancy, a link of indicators, an overload of indicators, a redundant overload and finally a situation of general interpretation. ;
- FIG. 22 illustrates an example of a parallel Petri dish
- FIG. 23 shows a descriptive matrix and the connections in the case of the parallel Petri net
- FIG. 24 illustrates an example of the linear Petri dish
- FIG. 26 illustrates a graph of the links of a KPI chain
- FIG. 29 shows a Petri dish in an exemplary embodiment
- FIG. 30 is a diagram illustrating means for implementing the invention.
- FIGS. 31 to 36 and 38 to 42 are diagrams illustrating the construction of the three-dimensional representation of the variable supervision system
- FIGS. 43 and 44 are two examples of representations resulting therefrom.
- KPIs Key Performance Indicators
- the method implements a dedicated graph grammar which makes it possible to automate the modeling of the Petri nets from the simple replay of the significant codification of the KPIs thus obtained.
- This codification constitutes the new entry key for a data warehouse (data warehouse of the technical indicators and trades specific to the observed system) and facilitates the setting up of a database by means of for example a technology of the groups assisted by computer (or TGAO ), dedicated to the capacity analysis activity.
- a thesaurus is a hierarchical dictionary, a standard vocabulary based on generic terms and domain-specific terms. It provides only incidental definitions, the relations of the terms and their choice outweighing the meanings. However, when a thesaurus is based on a significant codification, the codification of an object is not only the reference of this one, but carries in addition a semantics specifying the case of employment. A thesaurus is finally a tree of ordered sets of references, a classification being only the simple fact of relating objects to these references. As part of the capability analysis activity, these objects are here the business chains.
- a codification is a set of rules defining a one-to-one correspondence (bijection) between information and their representation by characters, symbols or signal elements. It can be a so-called significant or chronological codification. For any business chain thus referenced within a classification specific to capability analysis, there is a unique reference for authenticating and tracing it.
- a figurative coding is a mnemonic method allowing access to data and information specific to a given object. Preferably, this codification only applies to immutable objects in time. In all other cases, the implementation of the thesaurus becomes more complex, losing also the benefit of the internal coherence of the latter.
- a grammar is a formalism to define a syntax and thus a formal language, that is to say a set of words on a given alphabet.
- a grammar sets the rules for writing non-arbitrary code.
- Fig. 1 thus illustrates this correspondence between a formal language and a business family.
- a decision process depends directly on the quality of the data stored within the warehouse. For this reason, it is preferable to carry out an inventory of the data quality attributes of indicators. For each of these attributes, we define a definition, build a metric, measure the metric score, and track the progress of the measurements in real time. These attributes are: Consistency, Completeness, Accessibility, Integrity, Accuracy, Validity, and Timeliness.
- referential integrity is a set of computer rules that prevents data from being deleted or inadvertently changed from one table to another.
- integrity refers to the state of the data that, during processing, storage or transmission, does not undergo any alteration or destruction, and retains a format for reuse.
- the concept of data integrity encapsulates two other attributes of data quality:
- each data has a unique and verifiable identity (proof);
- each data belongs to an easily identifiable chain (path).
- ⁇ jk denotes the cross-delay of l k with respect to I 1 .
- Induced indicator any indicator that is not an elementary indicator is induced
- an induced indicator becomes a KPI indicator in the sense of the group if and only if it does not allow other indicators to be deduced.
- a KPI indicator is always placed at the end of the chain at the end of the correlation process;
- KPI string any group, here a string, consisting of elementary indicators, induced and a KPI whose sequences are all known and derived from correlation calculations. There can be multiple KPI strings within a single business chain;
- - contribution coefficient any contribution level, expressed in the SI, from one indicator to another.
- a change in the value of l k by 10 units results in a change in the value of /; of the order of -1000 of these same units;
- the covariance of indicators is recognized as valid once its absolute value converges to 0. In this case only, we can affirm that these indicators are independent and that they are never correlated. In this calculation, the convergence threshold towards 0 must be evaluated at the end of the experiment;
- experience feedback may be relevant when the calculation alone does not allow to conclude;
- a M be the descriptive matrix of M such that:
- a nb be the connectivity matrix of M such that:
- a n ⁇ is a square matrix that is hollow and symmetrical and whose diagonal is always zero.
- a N be the descriptive matrix of! M kp ⁇ such that:
- yA w is a symmetrical hollow square matrix whose trace is always equal to N.
- a m is a symmetrical hollow square matrix whose diagonal is always zero.
- Figure 3 illustrates the Petri net of a redundant character.
- Figure 4 illustrates the Petri network of an indicator link.
- K "-. ⁇ VJM ⁇ K "-. ⁇ VJM ⁇ , depends directly on the number of elementary indicators present within the observed business chain (all KPIs aside). The number nb is always greater than or equal to m. This is why we first stop at the particular case of a business chain with a single KPI indicator.
- this chain amounts to stacking linearly (any contribution coefficient excepted) all the elementary indicators by means of successive superimpositions.
- Figure 6 illustrates the stacking of the elementary indicators within M 1 ⁇ and shows what happens within the KPI chain studied. From these two representations, we deduce that the number of superposition bonds present in M 1 ⁇ is m -1.
- each KPI string must be treated separately.
- the stacking is necessarily parallel, as shown in FIG. 8 which illustrates the stacking of the nb elementary indicators within M if there are two KPIs.
- the connectivity matrix of! M takes the form illustrated in Figure 7.
- the business chain thus has two KPI strings: ⁇ kp ⁇ 1 and! M kP a-
- each KPI string to be treated separately the stack retained is always linear.
- the number of superimposed links within the KPI 5W kp ⁇ chain is m -1. So we describe the chain
- KPI ⁇ ⁇ , ⁇ A, ⁇ -J m , ⁇ -, I N ⁇ as in Figure 9 which illustrates the Petri net of linear stacking of elementary indicators within 5W kP,.
- the general shape of the Petri net allows us to specify one of the data quality attributes for the studied chain, namely completeness (all necessary data are available in the database).
- completeness all necessary data are available in the database.
- VN odd> 1: m - + 1
- the number of elementary indicators actually obtained in a KPI chain informs us about the relevance of the choices that are made.
- the KPI string is overheard.
- the indicators then tend to become redundant and the descriptive matrix "horizontalizes".
- the matrix is illustrated in Figure 10.
- the indicators I 1 , k and // are redundant.
- the KPI string is not listened to enough.
- the indicators tend to overload certain indicator links and the descriptive matrix "verticalises".
- the matrix is illustrated in Figure 1 1.
- the correlation calculations should not be oriented by expert opinion.
- Petri net is a classic mathematical tool for describing relationships between conditions and events and for modeling the behavior of dynamic discrete event systems.
- a Petri net is a kind of oriented tree also called alternating bipartite graph, that is to say that there is alternation of types of nodes.
- the descending algorithm consists of building the Petri net from the KPI to the supposedly basic indicators. This algorithm implies a random and recursive "de-stacking". During each cycle, the algorithm checks the connections between the supposedly elementary indicators. But it is necessary to wait for the appearance of uncorrelated indicators so that the algorithm discards this proposition of the result before starting a new random and recursive cycle again. This method of treatment is therefore not very advantageous.
- the upstream algorithm takes into account, from the set of indicators present within the KPI chain, filiations and therefore the genealogy resulting from the calculation of correlations and the interpretation of the descriptive matrix. If the ordering of the indicators is mastered, which implies that the set of cross-correlations is calculated, and if the completeness of the data is verified, which implies that the KPI chain is exhaustive to the point of avoiding overload of indicators and multiple redundant characters, the upstream algorithm then allows two types of Petri nets:
- FIG. 24 V ⁇ and shown in FIG. 24.
- This is an example of a linear Petri dish.
- Figure 25 shows the descriptive matrix and the connections in the case of the linear Petri dish.
- the connectivity matrix is identical for a different number of indicators. In both cases, it is a linear stack.
- the upstream algorithm In general, to proceed with the generation of the Petri net, the upstream algorithm must operate by successive iterations t ⁇ - t + 1, from the threshold represented by the set of elementary indicators, on which the redundant characters have been applied. possible, by combining all the elementary or induced indicators already available, in order to find all the induced indicators and missing KPIs resulting from the superposition of elementary indicators. At each iteration, the upstream algorithm must ensure that the integrity rules specific to the redundancy or overlay operations are respected. The process continues until the final KPI is obtained. It should be noted that, at each iteration t, the upstream algorithm must preserve the integrity of the indicators already obtained at the iteration t-1.
- U x is a symmetrical hollow square matrix whose diagonal is always zero.
- 5W k p ⁇ - is linear as shown in Figure 27.
- the descriptive matrix and the connections of this KPI chain are illustrated in Figure 28.
- the links of the lines relating to M i7 and M i8 can be made simultaneously.
- the state of a KPI can therefore be modeled by a tree structure of Petri net, each place of which represents an indicator in a given state.
- this tree is coded in the form of a well-parented symbol chain, where each symbol represents either an indicator or an operation, and each parenthesis level in the chain represents a particular branch of the Petri network.
- a "well-parented" string is such that any open parenthesis is necessarily closed at another point in the chain.
- the Petri net for modeling this indicator has a unique code represented by the following string:
- x denotes a redundancy operation
- 0 denotes the lack of information in this part of the link.
- rule (a) the elementary indicators present in the Petri network chain are replaced by the "singleton" type links; the elementary indicators are easily identifiable since they are always placed after the symbols [and +. This rule only applies once at the beginning of treatment;
- rule (b) the processing threshold of the upstream algorithm is updated before each iteration by replacing all the redundant characters applied only on the elementary or integrated indicators, by the corresponding redundancy operations.
- the redundant characters concerned are represented by x /, and are always placed after the symbol), the rule (a) having been carried out before the rule (b) at the beginning of treatment;
- rule (d) this is the rule of "Russian dolls” also known as simplification of the writing of the links.
- the operations concerned are represented by the sequences of type ((I), (J), (K)) U ((L), (M), (N)) for the redundancy or
- a device 2 such as a server is connected to at least one database 4 of a data warehouse (the base can form the latter).
- the database contains the indicators relating to at least one object such as the organization itself or its activities, this object taking several states (for example at successive dates), with each corresponding indicator of the values associated with the states. respectively.
- the device 2 comprises in particular a central unit and a memory forming means capable of identifying, as explained above, correlations between at least some of the indicators. For example, three indicators I 1 will be considered ,
- the means are able to form groups such as chains each consisting of an indicator and indicators correlated to it and sufficient to deduce the latter.
- groups such as chains each consisting of an indicator and indicators correlated to it and sufficient to deduce the latter.
- I 1 and I 2 induce I 3 . It is therefore the group [I 1 , I 2 , I 3 ).
- the means are capable of constructing the group's Petri net and coding it by means of the grammar as indicated above.
- FIG. 30 also relates to another data item N relating to another group concerning I 1 and I 2 but not I 3 .
- the operation of the base can be done as follows.
- an operator such as a person consults the device 2 from his computer 6 connected to a telecommunication network 8 such as the Internet or an intranet, via a server 10 of the organization. For example, he wants to know a recent value of the indicator I 1 .
- the device 2 identifies in the base 4 the data M and N indicating an identity of the indicators I 2 and I 3 correlated with the indicator consulted 11.
- the device deduces from the codification by means of the grammar the cause-and-effect relationships between the M group indicators. It does the same with those of group N.
- the device is also able to exploit these identities, for example by transmitting these identities to the device 10 responsible for constructing and modifying a web page 12 consulted by the operator, so that the device 10 makes it appear the identities of the identified indicators and their relations.
- the operator is thus informed, after having consulted the indicator I 1 on the page, that he should also be attentive to the value of the indicators I 2 and / 3 which are correlated to him.
- the means 2 identify correlations between at least some of the indicators
- the means 2 form groups each consisting of an indicator and indicators correlated to it and sufficient to deduce the latter;
- the means associate, in the base 4, with each of the indicators of the group, a data indicating an identity of the other indicators of the group.
- the means identify in the base 4 at least one data item M and N indicating an identity of the indicators I 2 and I 3 correlated with a consulted indicator U and forming with it a group such that the indicators of the group, except one, are sufficient to deduce the latter, and
- the means exploit the identities of the identified indicators, for example by transmitting them over the network 8.
- Devices 2 and 10 comprise one or more computer programs comprising code instructions adapted to control the implementation of at least some of the steps of the method when executed on a computer.
- This program can be put on a recording medium such as a disc
- This program can be made available on a telecommunication network such as network 8 for download.
- the invention makes it possible to go even further by performing monitoring or three-dimensional monitoring of the variables, as we will now show.
- CsKPI allows the supervision of the fragility points of the observed complex system. It thus makes it possible to precisely locate incidents, to follow the propagations, the ricochets, but also to precisely measure their propagation times. It finally allows simulation, stimulation and optimization of the supervision model.
- CsKPI also produces another tool for analysis and decision support that is a three-dimensional monitoring of variables. This monitoring makes it possible to evaluate the completeness of a supervisory tool vis-à-vis the complex system observed. Completeness is also one of the attributes of the quality of supervision data, as listed above.
- the vectors being positioned with their origin in the center of a sphere representing the object and their end on the sphere.
- the observed complex system takes the form of a sphere and the supervision system takes the form of a mesh, for example of the geodesic type, which winds progressively around the sphere.
- variable observation vectors it is possible to represent the variables present in the enterprise data warehouse in the form of variable observation vectors over time. These vectors are positioned relative to each other by means of the mathematical correlation coefficients which are here the principal cosines of the observation vectors constructed two by two. In reality, this construction should be hyperspherical given the fact that we are working in a Euclidean space of equivalent size to the cardinal of the data warehouse, namely the number of supervision variables. For technical reasons, we choose in this case to flatten this hypersphere to work only in a three-dimensional space.
- a spherical triangle is the smallest portion of a sphere bounded by three large circles centered at 0, the center of the sphere, and having the same radius as that of the sphere.
- the sides of this triangle are curves whose extensions are circles of the same radius as that of the sphere, as shown in Figure 31.
- the three points A, B, C on the sphere delimit the "spherical" triangle.
- the figure illustrates the sphere in its initial configuration: B is at the pole on the z axis, A is one of the intersection points of the sphere with the plane passing through the z and x axes.
- Figure 32 shows us a simple triangle at the end of the projection.
- the projection of Figure 2 is not entirely accurate. In fact, this is not the yOz plan, but the COB plane, which does in no way affect the calculations given the assumptions on angles.
- the first vector I 0 is positioned on the Z axis of the orthonormal coordinate system of FIG. 38.
- the sphere having a radius of 1 the first vector has a norm of 1 with the Cartesian coordinates (0,0,1). This vector is therefore the first pole of our construction.
- the vector I 1 represents the variable most strongly correlated positively in the sense of the CsKPI with respect to the reference variable, and to simplify the computation of its coordinates, we place its end on the plane xOz.
- ⁇ O i is the angle between the two vectors and the cosine of this angle is actually the directional cosine or the correlation coefficient contained in the matrix of correlations.
- Fp 01 is the direction cosine contained in the correlation matrix, positive and in the range [0.866, 1]. It must be a remarkable correlation in the sense of the descriptive matrix.
- the third vector I 2 represents the most highly positively correlated variable in the sense of CsKPI, and that respectively relative to I 0 and I 1 . This is where the triangulation method comes in.
- the placement of I 2 is done from the positions of I 0 and I 1 as illustrated in FIG. 40.
- the cosine of the angle ⁇ oi which separates the vectors ⁇ 0 and I 1 is therefore situated in the correlation matrix in the box corresponding to the two associated variables. It must be positive and in the interval [0.866, 1]. It must be a remarkable correlation in the sense of the descriptive matrix.
- the second vector of this base is deduced from the following vector product:
- the third vector of this base is deduced from the following vector product
- This formulation thus produces the construction rules of the complementary tool allowing the three-dimensional monitoring of the variables.
- a broken line 14 is constructed on the surface of the sphere 16 by connecting together the ends of the vectors in order of construction thereof.
- Figure 43 is a representation in non-alternating or geodesic mode. To obtain it, the sign of the ordinate of each observation vector is forced to "+".
- the "peel” type display makes it possible to evaluate the completeness of the supervision system, while the “geodesic” type display makes it possible to evaluate the homogeneous distribution of the variables around the observed system.
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Le procédé vise à organiser une base de données (4) comprenant des variables, telles que des indicateurs [I
1
, I
2
,I
3
), relatives à un objet prenant plusieurs états, à chaque variable correspondant des valeurs associées aux états respectifs. Dans le procédé : - des moyens automatisés (2) identifient des corrélations entre au moins certaines des variables; - les moyens (2) forment des groupes constitués chacun par une des variables (/3) et d'autres [I
1
, I
2 ) des variables corrélées à cette dernière et suffisant pour déduire cette dernière; et - les moyens (2) associent, dans une base de données (4), à chacune des variables du groupe, une donnée (M) indiquant au moins une identité des autres variables du groupe.
Description
Procédé pour organiser des variables dans une base de données
L'invention concerne les outils d'aide à la décision et l'organisation des variables dans une base de données.
On peut à titre d'exemple se référer au secteur des télécommunications. Dans ce dernier, l'ensemble de la production est mis en œuvre par le biais d'un système d'information qui gère à la fois les flux liés aux communications des clients (voix, SMS, MMS, Internet, etc .), les flux liés à la prospection et à la commercialisation, les flux liés au suivi financier, les flux liés au suivi de la qualité de service, les flux liés à la performance opérationnelle, etc.. Tous ces flux sont écoutés en temps réel au moyen d'agents informatiques (tels que des robots) qui collectent toutes sortes de données, avec des granularités plus ou moins fines selon les besoins des analyses (cela va généralement de la minute à l'heure).
II existe généralement un agent par indicateur mesuré. Ces indicateurs vont de l'espace disque disponible sur une baie de disques durs, au débit informatique sur telle ou telle branche du réseau, en passant par les taux des charges des unités centrales des serveurs concernés, ou même plus simplement le nombre de connexions de clients sur tel ou tel serveur d'applications, etc.. Ainsi, la personne en charge de l'analyse capacitaire (ou capacity planning en anglais) de l'entreprise dispose de l'ensemble des données dites d'apprentissage (l'histoire du système complexe observé) stocké au sein d'un entrepôt de données (en anglais datawarehouse).
Aussi, lorsque des personnes en charge des maîtrises d'œuvres ou d'ouvrages ont besoin d'un état du système d'information à un moment donné, l'analyste capacitaire est en mesure de leur en donner lecture. Ou même au-delà, lorsqu'une personne en charge de l'informatique décisionnelle (en anglais business intelligence) souhaite redéfinir des objectifs pour des activités au sein de l'entreprise (que l'on peut appeler objectifs métiers pour des chaînes métier), c'est cet analyste qui lui donne une lecture possible des indicateurs directement impactés par ces nouvelles prévisions. Ainsi, l'activité d'analyse capacitaire s'apparente à une surveillance permettant de donner une lecture de l'état de santé de l'entreprise, depuis les ventes réalisées en temps réel au sein des agences ou via Internet, jusqu'à l'ensemble des connexions réseau qu'il faut prévoir pour répondre à la demande.
En outre, l'analyse capacitaire permet d'établir des plans de contingence qui sont des outils d'aide à la décision : si une alerte est donnée quant au fonctionnement
d'un serveur d'application, il est souhaitable d'anticiper toutes les alertes à venir et de prendre les bonnes décisions afin d'éviter que la crise ne s'étende à l'ensemble de la production.
Mais jusqu'à présent, c'est principalement le retour d'expérience qui permet à l'analyste capacitaire d'envisager certaines conclusions.
En effet, le système d'information est en perpétuelle évolution et il est difficile pour l'analyste capacitaire d'anticiper les évolutions possibles (suppression ou ajout d'un serveur, diminution ou augmentation d'un ensemble de connexions, variation du nombre d'utilisateurs en agence, migration vers de nouvelles applications, etc.). De même, il lui est difficile de définir les nouveaux agents qui sont alors nécessaires à une lecture optimale de l'ensemble des indicateurs.
Plus généralement, on connait des indicateurs appelés indicateurs clé de performance (ou KPI pour l'anglais Key Performance Indicator). Jusqu'à présent, le référentiel KPI est un outil dont la conception est réservée à l'informatique décisionnelle, qui procède en s'appuyant uniquement sur la nomenclature des métiers concernés. De son côté, l'analyste capacitaire doit garantir en permanence la tenue en charge du système complexe en fonction de la planification des objectifs métiers. Les experts de l'informatique décisionnelle font sans le savoir des choix qui influencent le système d'information. De leur côté, les analystes capacitaires se heurtent à la complexité du système d'information et appréhendent mal les chaînes métiers concernées depuis les indicateurs techniques observables jusqu'au KPI proprement dit. L'analyste tend à considérer que toute similitude remarquable entre deux indicateurs implique une relation de cause à effet, ce qui fausse considérablement les analyses capacitaires et les rapports de l'informatique décisionnelle. Il s'ensuit qu'on obtient des indicateurs souvent redondants ou surchargés au sein d'un système complexe devenu de facto compliqué, mal observé et coûteux, réduisant ainsi lourdement le retour sur investissement.
En outre, parmi les nombreux facteurs de dégradation de la qualité des données d'un entrepôt de données, il faut retenir la migration des données, la rupture des intégrités référentielles et les temps d'attente extrêmement long des clients du système complexe observé. Dans tous les cas, ce sont bien la stabilité et la fiabilité du gisement de données des indicateurs qui sont remises en cause. Et l'attribut commun de la qualité des données qui est remis en cause reste l'intégrité du référentiel d'indicateurs afin de ne pas effacer ou de modifier par inadvertance les données d'une table en relation avec une autre.
Un but de l'invention est donc d'améliorer la qualité des décisions reposant sur des variables telles que des indicateurs.
A cet effet, on prévoit, selon l'invention, un procédé pour organiser une base de données comprenant des variables, telles que des indicateurs, relatives à un objet prenant plusieurs états, à chaque variable correspondant des valeurs associées aux états respectifs, procédé dans lequel :
- des moyens automatisés identifient des corrélations entre au moins certaines des variables ;
- les moyens forment des groupes constitués chacun par une des variables et d'autres des variables corrélées à cette dernière et suffisant pour déduire cette dernière ; et
- les moyens associent, dans une base de données, à chacune des variables du groupe, une donnée indiquant au moins une identité des autres variables du groupe.
Ainsi, l'invention procède en s'appuyant sur les corrélations réellement observables au sein du gisement de données des variables relatives au système complexe observé. Elle assure la corrélation et la codification significative des variables clé au sein de l'analyse capacitaire et permet d'établir une véritable cartographie des variables entre elles, tout en consolidant l'intégrité des données au sein de l'entrepôt de données (authenticité et traçabilité). Le procédé permet d'organiser des variables discrètes et chaotiques en une arborescence montrant les relations de cause à effet probables, depuis les variables dites élémentaires, jusqu'aux variables clé. L'invention permet une meilleure compréhension du système d'information en temps réel. Elle rend possible une automatisation des plans de contingence, des opérations de surveillance et de la gestion des alertes. L'invention permet une lecture rapide des impacts liés aux prévisions (côté informatique décisionnelle) comme aux crises (côté maîtrise d'œuvre ou d'ouvrage). Mieux qu'une étude d'impact, la base obtenue avec l'invention peut-être mise à jour régulièrement afin de prendre en compte les dernières évolutions au sein du système d'information.
Avantageusement, les moyens construisent un graphe, tel qu'un réseau de Pétri, du groupe, par exemple au moyen d'un algorithme montant.
Ainsi le graphe encapsule l'identité de la variable clé et le groupe auquel il appartient.
Avantageusement, les moyens codent le graphe pour produire la donnée.
Ce code permet de retrouver rapidement et facilement le graphe correspondant, et donc les identités des variables et leurs relations. Cette codification significative des variables renforce la qualité des données au sein d'un entrepôt de données, en
termes d'intégrité d'abord (authenticité et traçabilité), mais aussi en termes de complétude. Cette forme de représentation comme graphe, combinée à la codification significative, autorise un traitement ultérieur par exemple d'hypersphérisation ou d'iconographie, ainsi qu'une modélisation de type file d'attente.
Dans un mode de réalisation :
- on sélectionne une des variables et on place un vecteur correspondant à la variable;
- on sélectionne une des variables qui lui est le plus étroitement corrélée et on place un vecteur correspondant à cette variable à une position représentant cette corrélation ;
- puis, autant de fois que nécessaire, on sélectionne une des variables qui est le plus étroitement corrélée à celles correspondant à un vecteur déjà positionné et on place un vecteur correspondant à cette variable à une position représentant cette corrélation,
les vecteurs étant positionnés avec leur origine au centre d'une sphère représentant l'objet et leur extrémité sur la sphère.
Ce mode de représentation permet d'évaluer le degré de pertinence à l'égard de l'objet des variables considérées et la complétude de l'outil de supervision vis-à-vis du système complexe observé.
On prévoit aussi selon l'invention un procédé pour exploiter des variables, telles que des indicateurs, relatives à un objet prenant plusieurs états, à chaque variable correspondant des valeurs associées aux états respectifs, procédé dans lequel ;
- des moyens automatisés obtiennent dans une base de données au moins une donnée indiquant une identité de variables corrélées à une variable prédéterminée et formant avec elle un groupe tel que les variables du groupe, sauf une, suffisent pour déduire cette dernière, les moyens identifiant ainsi les variables corrélées ; et
- les moyens exploitent les identités des variables identifiées, par exemple les transmettent sur un réseau de télécommunication.
De préférence, les moyens identifient à partir de la donnée des relations de cause à effet entre les variables du groupe.
Avantageusement, les moyens commandent la mention sur une page web des identités des variables identifiées.
On prévoit également selon l'invention un programme d'ordinateur qui comprend des instructions de code apte à commander la mise en œuvre d'un procédé selon l'invention lorsqu'il est exécuté sur un ordinateur.
On prévoit aussi la mise à disposition de ce programme sur un réseau de télécommunication en vue de son téléchargement, ainsi qu'un support d'enregistrement de données comprenant ce programme sous forme enregistrée.
On prévoit aussi selon l'invention un dispositif pour organiser une base de données comprenant des variables, telles que des indicateurs, relatives à un objet prenant plusieurs états, à chaque variable correspondant des valeurs associées aux états respectifs, le dispositif comprenant des moyens aptes :
- à identifier des corrélations entre au moins certaines des variables ;
- à former des groupes constitués chacun par une des variables et d'autres des variables corrélées à cette dernière et suffisant pour déduire cette dernière ; et
- à associer, dans une base de données, à chacune des variables du groupe, une donnée indiquant au moins une identité des autres variables du groupe.
On prévoit également selon l'invention un dispositif d'exploitation de variables, telles que des indicateurs, relatives à un objet prenant plusieurs états, à chaque variable correspondant des valeurs associées aux états respectifs, le dispositif, éventuellement conforme au dispositif précité, comprenant des moyens aptes ;
- à obtenir dans une base de données au moins une donnée indiquant une identité de variables corrélées à une variable prédéterminée et formant avec elle un groupe tel que les variables du groupe, sauf une, suffisent pour déduire cette dernière, les moyens étant aptes ainsi à identifier les variables corrélées ; et
- à exploiter les identités des variables identifiées, par exemple à les transmettre sur un réseau de télécommunication.
On prévoit par ailleurs selon l'invention une base de données qui comprend :
- des variables relatives à un objet prenant plusieurs états, à chaque variable correspondant des valeurs associées aux états respectifs;
- au moins une donnée en relation avec au moins une des variables et indiquant une identité de certaines des variables corrélées avec elle et formant avec elle un groupe tel que les variables du groupe, sauf une, suffisent pour déduire cette dernière.
On peut employer l'invention auprès d'entités ayant des besoins dans les domaines de l'informatique décisionnelle ou de l'analyse capacitaire. Tous les secteurs industriels sont concernés par cette invention : nucléaire, transport, pharmaceutique, cosmétique, automobile, équipementiers, énergie, financier, assurance, etc.. En effet, quel que soit le domaine d'application, peu importent les noms qui sont donnés aux variables, dès lors que les exigences propres à la
technique sont respectées et qu'une lecture en temps réel est possible. L'invention peut ainsi s'appliquer par exemple dans les domaines suivants:
- nucléaire : température intérieure d'une boîte à gants, température de la matière chaude en cours d'usinage, débit du lubrifiant, épaisseur des gants de manipulation, temps d'ouverture des hublots, temps d'exposition des techniciens, etc
- pharmaceutique : rendement d'un îlot automatisé de conditionnement, décompte des gélules non conformes, décompte des substrats non conformes, vitesse de mise en place sous vide, décompte des substrats détériorés suite à la mise en place, etc...
- énergie : débit d'un fleuve, température de l'eau, débit du circuit de refroidissement, puissance du générateur, température du cœur, demande en énergie, consommation propre à la centrale, quantité d'énergie disponible, etc...
- économie : indices financiers et boursiers tels que le CAC 40, volume d'actions échangées, taux directeurs, taux interbancaires, volume de crédit, indice de volatilité, évolution du PIB, évolution du chômage, moral des entreprises, moral des consommateurs, etc...
L'invention sera mieux comprise à la lecture de la description qui va suivre, donnée uniquement à titre d'exemple et faite en se référant aux dessins dans lesquels :
- la figure 1 est un organigramme illustrant la correspondance entre un langage formel et une famille de métiers ;
- la figure 2 présente des courbes illustrant la liaison par superposition entre deux indicateurs ;
- les figures 3 et 4 sont des réseaux de Pétri d'un caractère redondant et d'une liaison d'indicateurs ;
- les figures 5 et 6 sont respectivement une matrice de connexités et l'empilement des indicateurs y relatifs ;
- les figures 7 et 8 illustrent les mêmes éléments dans le cas d'un empilement parallèle ;
- la figure 9 est le réseau de Pétri d'un empilement linéaire des indicateurs élémentaires au sein d'une chaîne ;
- les figures 10 et 1 1 montrent des matrices dans lesquelles respectivement les indicateurs sont redondants ou encore surchargent l'un des indicateurs ;
- les figures 12 à 14 sont des matrices illustrant respectivement l'initialisation de la matrice descriptive dans le procédé de l'invention, la définition de la zone élémentaire et enfin la forme générale en escalier ;
- les figures 15 à 21 sont des matrices et des réseaux de Pétri illustrant respectivement une redondance simple, un doublon, une redondance multiple, une liaison d'indicateurs, une surcharge d'indicateurs, une surcharge redondante et enfin une situation d'interprétation générale ;
- la figure 22 illustre un exemple d'un réseau de Pétri parallèle ;
- la figure 23 montre une matrice descriptive et les connexités dans le cas du réseau de Pétri parallèle ;
- la figure 24 illustre un exemple du réseau de Pétri linéaire ;
- la figure 25 présente la matrice descriptive et les connexités dans le cas du réseau de Pétri linéaire ;
- la figure 26 illustre un graphe des liaisons d'une chaîne KPI ;
- la figure 27 montre l'empilement des indicateurs élémentaires au sein de la chaîne KPI ;
- la figure 28 montre la matrice descriptive et les connexités au sein de cette chaîne ; - la figure 29 montre un réseau de Pétri dans un exemple de réalisation; et
- la figure 30 est un schéma illustrant des moyens de mise en œuvre de l'invention ;
- les figures 31 à 36 et 38 à 42 sont des diagrammes illustrant la construction de la représentation en trois dimension du système de supervision des variables ;
- la figure 37 illustre un principe de cette représentation ; et
- les figures 43 et 44 sont deux exemples de représentations en résultant.
Nous allons présenter ci-après des exemples de mise en œuvre de l'invention dans lesquels les variables sont des indicateurs, l'invention n'étant pas cependant réduite à ce cas.
Il s'agit d'un procédé de codification significative des indicateurs clés de performance ou KPI (pour l'anglais Key Performance Indicators). Il met en œuvre en l'espèce :
- des calculs de corrélation des indicateurs d'un système complexe observé (matrice de variances-covariances, matrice de corrélations mathématiques et matrice de corrélations croisées);
- la construction et l'interprétation de matrices dites descriptives et de connexités, et
- la représentation de l'ensemble des chaînes KPI modélisées sous la forme de graphes tels que des réseaux de Pétri.
Le procédé met en oeuvre une grammaire des graphes dédiée qui permet d'automatiser la modélisation des réseaux de Pétri à partir de la simple relecture de la codification significative des KPI ainsi obtenue. Cette codification constitue la
nouvelle clé d'entrée d'un entrepôt de données (gisement de données des indicateurs techniques et métiers propre au système observé) et facilite la mise en place d'une base de donnée moyennant par exemple une technologie des groupes assistée par ordinateur (ou TGAO), dédiée à l'activité d'analyse capacitaire.
Nous allons expliquer d'abord comment définir, construire et utiliser la base de données propre à l'entrepôt de données.
On utilise une classification des chaînes métiers étudiées qui désignent ici des groupes de variables associés à une même activité au sein du système observé (vente, production, qualité etc.). Il s'agit de retrouver rapidement leurs codes grâce à l'usage d'un thésaurus dans la base. Pour cela, nous construisons une codification significative, voir figurative, de ces chaînes métiers, puis nous associons au résultat ainsi obtenu une codification chronologique, le tout constituant la nouvelle clef d'entrée de l'entrepôt de données.
Un thésaurus est un dictionnaire hiérarchisé, un vocabulaire normalisé sur la base de termes génériques et de termes spécifiques à un domaine. Il ne fournit qu'accessoirement des définitions, les relations des termes et leur choix l'emportant sur les significations. Toutefois, lorsqu'un thésaurus s'appuie sur une codification significative, la codification d'un objet n'est plus seulement la référence de celui-ci, mais porte en plus une sémantique précisant le cas d'emploi. Un thésaurus est finalement une arborescence d'ensembles ordonnés de références, une classification n'étant que le simple fait de mettre en relation des objets avec ces références. Dans le cadre de l'activité d'analyse capacitaire, ces objets sont ici les chaînes métiers.
On considère ici qu'une codification est un ensemble de règles définissant une correspondance biunivoque (bijection) entre des informations et leur représentation par des caractères, des symboles ou des éléments de signal. Il peut s'agir d'une codification dite soit significative soit chronologique. Pour toute chaîne métier ainsi référencée au sein d'une classification propre à l'analyse capacitaire, il existe une référence unique permettant de l'authentifier et de la tracer.
Une codification figurative est une méthode mnémotechnique permetant l'accès aux données et aux informations propres à un objet considéré. De préférence, cette codification ne s'applique qu'à des objets immuables dans le temps. Dans tous les autres cas, la mise en place du thésaurus n'en devient que plus complexe, perdant aussi le bénéfice de la cohérence interne de ce dernier.
Une grammaire est un formalisme permettant de définir une syntaxe et donc un langage formel, c'est-à-dire un ensemble de mots sur un alphabet donné. En d'autres termes, une grammaire fixe les règles permettant d'écrire un code non arbitraire. Il
existe une similitude entre la génération des phrases à partir des symboles (mots) respectant une sémantique liée à une langue donnée et la génération des chaînes métiers à partir des indicateurs métiers ou techniques, en considérant les relations de cause à effet. La Fig. 1 illustre ainsi cette correspondance entre un langage formel et une famille métiers.
Nous rappelons ci-après quelques outils de corrélation.
Soit un vecteur aléatoire x à N indicateurs temporels discrets et chaotiques X1 présentant des pas de collecte différents au sein de l'entrepôt de données. La première étape consiste donc en une interpolation pertinente des indicateurs les plus pauvres de sorte que chaque indicateur puisse disposer de n réalisations au sein de la même plage de temps:
Une fois cette préparation réalisée, les calculs concernent essentiellement les éléments suivants:
- la matrice de variances-covariances :
sachant que l'ensemble des calculs s'appuie sur la loi de Bravais-Pearson où
1
σxy = covi (χ' y) = 7∑ (x, - xXy, -y) = χ-y -χ-y
n ,_
1 "
avec ^ = -∑*, et où σx = -Jvarix) avec
n ï=i
1
var K(χ) = -∑(χ, -χ)2 = x -x
- la matrice de corrélations croisées (il est intéressant d'avoir les retards entre les indicateurs) :
sachant que l'ensemble des calculs s'appuie sur la méthode de corrélation croisée où Fxγ(τ) = E(X(t)Y(t -τ)) £ désignant l'espérance mathématique et o )uù ^χγ(T) = J X(t)Y * (t - τ)dt avec Y* désignant la transformée de la fonction Y telle que Y*(t -τ) = Y(t -τ)δTe(t -τ) et δTe(t -τ) =∑δ(t -τ -kTe) ,
^Te étant le peigne de Dirac de période d'échantillonnage Te
Nous détaillons plus loin le procédé de mise en œuvre de ces calculs permettant de proposer les relations de cause à effet au sein d'une chaîne métier, et d'en déduire une certaine forme de représentation, puis de codification significative.
Lors de la mise en place d'un entrepôt de données, on démarre par l'inventaire complet des composants constituant le modèle générique et unique, afin de donner une représentation fidèle de l'objet étudié. La construction de la base passe par les étapes suivantes :
- inventaire des données des chaînes métiers et des indicateurs attachés ;
- construction de la matrice des corrélations entre indicateurs deux à deux ;
- codification des chaînes métiers depuis les indicateurs élémentaires identifiés ; - classification des chaînes métiers codifiées ;
- relecture du thésaurus ;
- validation de la grammaire des graphes utilisée ;
- modélisation générique des chaînes métiers.
Cette construction se fait selon une lecture séquentielle de ces étapes. Quant à son utilisation, nous procédons de la manière suivante :
- depuis la classification au sein du thésaurus, sélection du code d'une chaîne métier ;
- depuis la grammaire des graphes retenue, lecture de l'ensemble des relations de cause à effet au sein de cette chaîne métier ;
- depuis le modèle de cette chaîne métier, hypersphérisation pour une représentation à la fois intuitive et cognitive.
Nous allons voir dans la deuxième partie comment nous pouvons automatiser l'écriture des chaînes métiers depuis les calculs de corrélation, et ainsi construire la base.
Un processus de décision dépend directement de la qualité des données stockées au sein de l'entrepôt. C'est pourquoi il est préférable de réaliser un inventaire des attributs de la qualité des données propres aux indicateurs. Pour chacun de ces attributs, nous établissons une définition, bâtissons une métrique, mesurons le pointage métrique et suivons la progression des mesures en temps réel. Ces attributs sont ici les suivants: la consistance, la complétude, l'accessibilité, l'intégrité, la précision, la validité et l'opportunité.
En gestion de base de données, une intégrité référentielle est un jeu de règles informatiques qui empêche d'effacer ou de modifier par inadvertance les données d'une table en relation avec une autre. De manière générale, l'intégrité désigne l'état des données qui, lors d'un traitement, d'une conservation ou d'une transmission, ne subissent aucune altération ou destruction, et conservent un format permettant leur réutilisation. La notion d'intégrité des données encapsule deux autres attributs de la qualité des données :
- authenticité : chaque donnée dispose d'une identité (preuve) unique et vérifiable ;
- traçabilité : chaque donnée appartient à une chaîne (parcours) facilement identifiable.
Concernant l'authenticité, cet attribut est généralement traité par le biais d'algorithmes de type MAC, Message Authentication Code connus en eux-mêmes. Concernant la traçabilité, cet attribut nous amène à la généralisation d'une codification universelle, qui doit être lue et comprise par tous, notamment ici par l'entrepôt de données.
Nous allons maintenant présenter comment on obtient les graphes et la codification significative.
Observons le cas particulier de trois indicateurs dont les données sont supposées être exprimées dans la même unité au sein du système international d'unités (SI).
Soit une chaîne métier !M fomant un groupe de trois indicateurs tel que !M = Vi >Ij >Ik j . La figure 2 illustre une liaison par superposition entre deux courbes d'indicateurs. Dans le couple lr Λt '#W, r Pιk désigne le coefficient de corrélation mathématique entre lk et /„ Ψ± désigne le retard croisé de lk par rapport à /,. Dans le couple
-Ψjk), r P]t désigne le coefficient de corrélation mathématique entre lk et I1,
Ψjk désigne le retard croisé de lk par rapport à I1.
Au sens graphique, nous observons une liaison par superposition entre les cours des indicateurs /, et I1. Nous notons cette liaison L11 ou L11, puisque nous pouvons considérer /, sous I1 ou I1 sous /,. Quels que soient les retards observés par rapport aux cours d'indicateurs sources, l'indicateur résultat lk est toujours obtenu par superposition des deux autres tout en tenant compte de leurs niveaux de contribution respectifs. En outre,on distingue le niveau de contribution et le coefficient de corrélation qui n'expriment pas la même chose. Au sens de la liaison, /, et I1 sont les indicateurs élémentaires. lk devient l'indicateur induit.
La recherche de l'ensemble des graphes permettant d'aboutir à la représentation de toute chaîne métier nécessite d'abord la définition d'un modèle unique permettant de représenter toutes les chaînes métiers possibles. On donne les définitions suivantes :
- indicateur élémentaire : tous les indicateurs non corrélés entre eux deux à deux au sein d'une chaîne donnée, sont des indicateurs élémentaires ;
- indicateur induit : tout indicateur qui n'est pas un indicateur élémentaire est induit ;
- indicateur KPI : un indicateur induit devient un indicateur KPI au sens du groupe si et seulement si il ne permet pas de déduire d'autres des indicateurs. Un indicateur KPI se trouve toujours placé en bout de chaîne à l'issue du traitement de corrélation ;
- chaîne KPI : tout groupe, ici une chaîne, constitué d'indicateurs élémentaires, induits et d'un KPI dont les enchainements sont tous connus et issus des calculs de corrélation. Il peut y avoir plusieurs chaînes KPI au sein d'une seule chaîne métier ;
- liaison d'indicateurs : une liaison entre deux indicateurs élémentaires ou induits se traduit toujours par la superposition des cours de ces indicateurs, tout en
tenant compte de leurs niveaux de contribution respectifs, afin de créer un nouvel indicateur induit au sein de la chaîne métier observée. Au-delà de deux indicateurs, nous disons que la liaison d'indicateurs est surchargée ;
- caractère redondant : il apparaît si un indicateur induit ne dépend que d'un indicateur élémentaire ou induit;
- coefficient SI : coefficient de transformation d'un indicateur élémentaire, induit ou KPI pour l'exprimer dans les unités du système international ;
- coefficient de contribution : tout niveau de contribution, exprimé dans le SI, d'un indicateur sur un autre. Exemple : une variation de la valeur de lk de 10 unités engendre une variation de la valeur de /; de l'ordre de -1000 de ces mêmes unités ;
- corrélation mathématique : le coefficient de corrélation mathématique entre deux indicateurs est ici reconnu valable dès que sa valeur absolue est supérieure ou
égale à ≈ 0,866 ; dès lors qu'elle tend vers 0, les deux indicateurs sont dits indépendants ;
- covariance d'indicateurs : la covariance d'indicateurs est reconnue valable dès que sa valeur absolue converge vers 0. Dans ce cas seulement, nous pouvons affirmer que ces indicateurs sont indépendants et qu'ils ne sont jamais corrélés. Dans ce calcul, le seuil de convergence vers 0 doit être apprécié à l'issue de l'expérience ;
- retard croisé : deux indicateurs corrélés entre eux ne sont vraisemblablement pas simultanés. Le retard croisé permet de quantifier ce décalage de réalisation dans le temps. Nous parlons aussi de déphasage dans le temps ;
- relation de cause à effet exprimée : le retour d'expérience peut s'avérer pertinent lorsque le calcul seul ne permet pas de conclure ;
- entropie de Shannon : lorsqu'un indicateur devient instable au sens de la distribution, son entropie de Shannon devient minimale et se rapproche brutalement de O.
Soit un groupe tel qu'une chaîne métier !M constituée de M indicateurs dont un nombre nb d'entre eux sont des indicateurs élémentaires.
Soit un groupe tel qu'une chaîne KPI ^kpι constituée de N indicateurs pris parmi ceux de la chaîne métier !M et dont m d'entre eux sont des indicateurs élémentaires.
Nous devons respecter les inégalités suivantes: m≤nb < M et m < N≤ M.
Nous pouvons noter les indicateurs /, V* e {1...M} .
Nous pouvons noter la chaîne métier M = Vi'—^nt'—^M
Soit X M le vecteur constitué des M indicateurs présents dans la chaîne métier M;
nous associons à toute corrélation identifiée valable et notée le nombre
y , ou 0 s'il n'y a pas de corrélation valable sachant que π,, = 1 ,
nous associons à toute liaison identifiée et notée L,7 le nombre
ou 0 s'il n'y a pas de liaison sachant que
Nous pouvons noter la chaîne KPI
nous associons à toute corrélation identifiée valable et notée le nombre π υ = 1 , ou 0 s'il n'y a pas de corrélation valable sachant que π,, = 1 ,
Soit A7, la matrice de connexité de !Mkpι telle que:
- ^Uj e {l.-.w} , nous associons à toute liaison identifiée et notée L11 le nombre δy = 1 , ou 0 s'il n'y a pas de liaison sachant que ^11 = 0 , V/ e {l...m} ;
- >Am=[av] / a,7= ^ = ^ =a7, ; Am est une matrice carrée creuse symétrique et dont la diagonale est toujours nulle.
Soient les représentations suivantes sous forme de réseau de Pétri:
- caractère redondant : La figure 3 illustre le réseau de Pétri d'un caractère redondant.
avec r Py e _- U] et <Pυ≥0 ;
Cette formule donne la relation entre deux indicateurs redondants avec:
a,
av = a, •cιj le coefficient de contribution de /, sur I1
(X1 et a j |es coefficients SI des indicateurs observés et cy le coefficient de contribution exprimé dans le SI de /, sur I1.
- liaison d'indicateurs : La figure 4 illustre le réseau de Pétri d'une liaison d'indicateurs. Avec r Puw e [" U], ^ e [-1,1] , φuw > 0 et <Pm≥ 0
K (0≡ PuJu (t - φm) + γjv (t - φj)
avec:
Puw = ~^~-cuw le coefficient de contribution de lu sur lw, βu et βw les coefficients SI de ces indicateurs observés et
- cuw le coefficient de contribution exprimé dans le SI de lu sur lw ;
Y
Yvw = ~^L-Cvw le coefficient de contribution de lv sur lw,
Yv et Yw les coefficients SI de ces indicateurs observés et cvw le coefficient de contribution exprimé dans le SI de lv sur lw.
Nous utilisons une forme de représentation simple et accessible de type réseau de Pétri qui, lorsqu'elle est temporisée et/ou colorée, autorise toujours toute démarche ultérieure et complémentaire d'hypersphérisation ou d'analyse sous forme de files d'attentes.
Le niveau de complexité du problème lié aux calculs des corrélations croit avec le nombre d'indicateurs constituant la chaîne métier observée. En effet, le nombre de liaisons par superposition au sein de la chaîne métier étudiée : M
= K »-. ^ VJM } , dépend directement du nombre nb d'indicateurs élémentaires présents au sein de la chaîne métier observée (tout KPI mis à part). Le nombre nb est toujours supérieur ou égal à m. C'est pourquoi, nous nous arrêtons d'abord au cas particulier d'une chaîne métier ayant un seul indicateur KPI.
La construction de cette chaîne revient à empiler linéairement (tout coefficient de contribution mis à part) l'ensemble des indicateurs élémentaires par le biais de superpositions successives. Dans ce cas, les chaînes métier et KPI sont strictement identiques ; N = M et nb = m. Lors d'un empilement linéaire, la matrice de connexité de Λήφi =
) est telle qu'illustré à la figure 5 La figure 6 illustre l'empilement des indicateurs élémentaires au sein de M 1 ^ et montre ce qui se passe au sein de la chaîne KPI étudiée. De ces deux représentations, nous déduisons que le nombre de liaisons par superposition présent dans M 1 ^ est m -1.
Il se peut lors du calcul des corrélations qu'une chaîne métier fasse ressortir non pas un KPI, mais plusieurs. Dans ce cas, chaque chaîne KPI doit être traitée distinctement. Dans le cas d'une chaîne ayant deux KPI, l'empilement est nécessairement parallèle, comme le montre la figure 8 qui illustre l'empilement des nb indicateurs élémentaires au sein de M s'il y a deux KPI. Dans cet exemple, la matrice de connexité de !M prend la forme illustrée à la figure 7. Nous en déduisons que la forme générale de la matrice de connexité permet de retrouver le nombre de KPI réellement présents au sein de la chaîne métier !M. Dans le cas présenté ci- dessus, la chaîne métier dispose donc de deux chaînes KPI : ^kpι1 et !MkPa- De façon générale, chaque chaîne KPI devant être traitée distinctement, l'empilement retenu est toujours linéaire. Ainsi, le nombre de liaisons par superposition au sein de la chaîne KPI 5Wkpι est m -1. Nous décrivons donc la chaîne
KPI Λήφ, = {A ,~-Jm ,~-, IN } comme sur la figure 9 qui illustre le réseau de Pétri de l'empilement linéaire des indicateurs élémentaires au sein de 5WkP,.
Soit G5V l'ensemble des réseau de Pétri possibles. Dans ce cas, le cardinal de
avec :
- Q1n , le nombre de combinaisons de 2 indicateurs élémentaires pris parmi m ;
- Pm-2 , le nombre de permutations des m -2 indicateurs élémentaires restants ; et
" An, > 'e nombre d'arrangements de 2 indicateurs élémentaires pris parmi m.
La forme générale du réseau de Pétri nous permet de préciser l'un des attributs de la qualité des données pour la chaîne étudiée, à savoir la complétude (toutes les données nécessaires sont disponibles dans la base). Ainsi, pour une chaîne KPI étudiée 5*WkP,, dont la forme générale du réseau de Pétri est elle aussi linéaire, la complétude est optimale si et seulement si le nombre d'indicateurs élémentaires est tel que :
N - I
VN impair > 1 : m =—— + 1
N
VN pair≥ 2 : m =— Ainsi, le card G2o à complétude optimale :
10!
card G20=^- = 1814400 = Card G19
De même, le card doo à complétude optimale s'écrit: card Gioo=— = l,5207046600856689021806304083032.1064 = card G99
Au vu de la complexité des calculs matriciels qui peuvent être exécutés lors des calculs de corrélation, pour arrêter le choix définitif du réseau de Pétri décrivant exactement la chaîne KPI ^kpι = Fi»"J, »-,'j} , nous retenons les deux critères suivants: la complétude des données et l'ordonnancement définitif des indicateurs selon l'ensemble des retards croisés calculés.
Le nombre d'indicateurs élémentaires réellement obtenus dans une chaîne KPI nous renseigne sur la pertinence des choix qui sont faits.
Supposons que dans un premier cas, la chaîne KPI est trop écoutée. Les indicateurs tendent alors à devenir redondants et la matrice descriptive « s'horizontalise ». Nous pouvons réaliser des économies de mesures et établir des
relations mathématiques afin de déduire par le calcul l'ensemble des indicateurs redondants depuis l'indicateur réalisé au plus tôt. La matrice est illustrée à la figure 10. Dans cet exemple, les indicateurs I1, k et // sont redondants.
Supposons que dans un second cas, la chaîne KPI n'est pas assez écoutée. Les indicateurs tendent alors à surcharger certaines liaisons d'indicateurs et la matrice descriptive « se verticalise ». Nous pouvons compléter la chaîne métier initiale et ajouter de nouveaux indicateurs induits pertinents afin de décomposer linéairement toute liaison surchargée depuis la liaison réalisée au plus tôt. La matrice est illustrée à la figure 1 1. Dans cet exemple, les indicateurs I1, lk et /; surchargent /,.
Dans les deux cas, c'est bien l'attribut de la qualité des données, la complétude, qui doit être renforcé, sans quoi le retour d'expérience peut très tôt s'avérer nécessaire par l'usage de relations de cause à effet exprimées par l'expert, ce que nous voulons éviter. De préférence, les calculs de corrélation ne doivent pas être orientés par les avis des experts.
Nous présentons maintenant la construction des matrices descriptives et de connexités. Voici quelle méthode de corrélation nous pouvons retenir pour expliquer une chaîne métier.
En tenant compte de la granularité la plus grossière, nous échantillonnons l'ensemble des indicateurs de cette chaîne afin de ne retenir que n réalisations ou observations. Dans certains cas, il est possible d'interpoler les réalisations manquantes sur des indicateurs dont la granularité trop grossière si elle est retenue provoque inévitablement une perte d'informations pertinentes au moment de l'échantillonnage.
Nous initialisons AM, la matrice descriptive de M, comme illustré à la figure 12.
Grâce aux possibilités offertes par l'analyse en composantes principales (ou
ACP), nous déduisons a priori∑χM , la matrice de variance-covariance, dont nous arrêtons, à l'issue de quelques expériences, le seuil acceptable de convergence vers 0, puis nous identifions les nb indicateurs élémentaires qui sont finalement présents au sein de la chaîne métier observée.
Nous mettons à jour AM en permutant d'abord l'ensemble des indicateurs de sorte que les nb indicateurs élémentaires se retrouvent en haut à gauche de la matrice descriptive, puis, diagonale mise à part, nous forçons tous les coefficients descriptifs de cette « zone élémentaire » à 0. La figure 13 montre la définition de la « zone élémentaire ».
Grâce à l'ACP toujours, « zone élémentaire » mise à part, nous déduisons a priori ^χM , la matrice de corrélation, puis nous identifions tous les coefficients de corrélation mathématique dits valables, c'est-à-dire dont les valeurs absolues sont
supérieures ou égales à ≈0,866. Dès lors qu'elles tendent vers 0, les indicateurs concernés sont dits indépendants, ce qui permet de compléter la "zone élémentaire".
Nous ordonnançons les indicateurs par le biais du calcul a priori de ^xu , la matrice croisée, qui permet de clarifier les retards croisés des indicateurs corrélés entre eux deux à deux dans la chaîne métier. L'ordonnancement s'obtient par le biais de permutations adéquates successives des lignes et des colonnes de la matrice, depuis les indicateurs réalisés en premier.
Nous mettons à jour AM en forçant à 0 l'ensemble des coefficients descriptifs dépourvus de toute corrélation, puis, en tenant compte des retards croisés, nous permutons les derniers indicateurs non-élémentaires afin d'obtenir une forme générale de la matrice descriptive qui soit la plus proche possible de sa diagonale. La figure 14 montre la forme générale en escalier. La matrice descriptive de M nous renseigne finalement sur la généalogie au sein de la chaîne métier observée. Et ce sont bien les calculs de corrélation qui nous permettent d'approcher au mieux l'ensemble de ces filiations.
Ensuite, de l'interprétation de la matrice descriptive AM ainsi obtenue, nous déduisons la matrice de connexité Anb . Nous déduisons de la lecture de Anb le nombre de KPI finalement présents dans la chaîne métier observée. Nous identifions clairement les chaînes KPI. Enfin, pour chaque chaîne KPI, nous construisons la matrice descriptive AN et la matrice de connexité Am, sans refaire les calculs, en nous appuyant simplement sur les résultats propre à la chaîne métier dans son ensemble.
Nous pouvons ensuite passer à l'étape construction du réseau de Pétri.
Le calcul des corrélations croisées joue un rôle important dans l'organisation de la matrice descriptive de M, tout comme celle de fΛiφ,. Néanmoins, ce calcul n'est pas simple a priori et peut même s'avérer impossible dans certain cas, surtout si la chaîne métier est trop complexe. Nous expliquons ci-après la matrice descriptive dès l'obtention des corrélations dites valables, sans qu'il soit nécessaire de passer par les calculs de corrélation croisée, l'ordonnancement étant de facto exprimé via le retour d'expérience, ou aléatoirement le cas échéant. Voici donc les différents cas que nous pouvons rencontrer dans le cas d'une chaîne KPI
] :
- le caractère redondant simple sur la figure 15.
- le caractère doublon sur la figure 16.
- le caractère redondant multiple à la figure 17.
- la liaison d'indicateurs à la figure 18.
- la surcharge d'indicateurs à figure 19.
- la surcharge redondante à figure 20.
- l'interprétation générale à la figure 21.
On automatise ici l'écriture des réseaux de Pétri depuis la connaissance des chaînes KPI. Le réseau de Pétri est un outil mathématique classique permettant de décrire des relations existant entre des conditions et des événements et de modéliser le comportement de systèmes dynamiques à événements discrets. Un réseau de Pétri est en quelque sorte un arbre orienté dit aussi graphe biparti alterné, c'est-à-dire qu'il y a alternance des types de nœuds. Nous nous intéressons ensuite à la circulation des marques au sein de cet arbre orienté. Dans la représentation d'une chaîne KPI, cet arbre orienté prend la forme d'une pyramide.
Considérons deux algorithmes de traitement possibles.
L'algorithme descendant consiste en la construction du réseau de Pétri depuis le KPI jusqu'aux indicateurs supposés élémentaires. Cet algorithme sous-entend un « dés-empilement » aléatoire et récursif. Lors de chaque cycle, l'algorithme vérifie les connexités entre les indicateurs supposés élémentaires. Mais il faut attendre l'apparition d'indicateurs non corrélés pour que l'algorithme écarte cette proposition du résultat avant de recommencer un nouveau cycle aléatoire et récursif. Cette méthode de traitement est donc peu avantageuse.
L'algorithme montant tient compte, depuis l'ensemble des indicateurs présents au sein de la chaîne KPI, des filiations et donc de la généalogie issue du calcul des corrélations et de l'interprétation de la matrice descriptive. Si l'ordonnancement des indicateurs est maitrisé, ce qui sous-entend que l'ensemble des corrélations croisées est calculé, et si la complétude des données est vérifiée, ce qui sous-entend que la chaîne KPI est exhaustive au point d'éviter les surcharges d'indicateurs et les caractères redondants multiples, l'algorithme montant autorise alors deux types de réseau de Pétri :
- le réseau de Pétri parallèle. Soit la chaîne KPI ordonnée !Mkpι
= (A ,I2 Α
'^9 'Λo ) , et représentée à la figure 22 comme un exemple de réseau de Pétri parallèle. On a illustré à la figure 23 la matrice descriptive et les connexités dans le cas du réseau de Pétri parallèle.
- le réseau de Pétri linéaire . Soit la chaîne KPI ordonnée 5Wkpι
= Vι
et représentée à la figure 24. Il s'agit d'un exemple de réseau de Pétri linéaire. La figure 25 montre la matrice descriptive et les connexités dans le cas du réseau de Pétri linéaire.
Dans ces deux exemples, la matrice de connexité est identique pour un nombre d'indicateurs différent. Dans les deux cas, il s'agit d'un empilement linéaire.
Nous présentons ici le théorème de l'algorithme montant. De façon générale, pour procéder à la génération du réseau de Pétri, l'algorithme montant doit opérer par itérations successives t <- t+1 , depuis le seuil représenté par l'ensemble des indicateurs élémentaires, sur lequel ont été appliqués les caractères redondants éventuels, en combinant tous les indicateurs élémentaires ou induits d'ores et déjà disponibles, afin de retrouver l'ensemble des indicateurs induits et KPI manquants issus de la superposition de t indicateurs élémentaires. A chaque itération, l'algorithme montant doit s'assurer du bon respect des règles d'intégrité propres aux opérations de redondance ou de superposition. Le processus se poursuit jusqu'à l'obtention définitive du KPI. On note que, à chaque itération t, l'algorithme montant doit préserver l'intégrité des indicateurs déjà obtenus à l'itération t-1.
Pour préciser les règles de l'algorithme montant, introduisons maintenant la notion de chaînon, sachant qu'une chaîne KPI est un chaînon complet incluant tous les indicateurs observés dont le KPI. Le principe de l'algorithme montant consiste donc à retrouver, depuis le seuil représenté par l'ensemble des indicateurs élémentaires, l'ensemble des chaînons manquants jusqu'à l'obtention définitive du KPI.
Soit un chaînon 'L' de la chaîne KPI considérée. Ce chaînon nous apporte deux informations :
- un ensemble de données représenté sous la forme d'un triplet ordonné
(( M M )) comprenant :
x indicateurs élémentaires ;
les liaisons d'indicateurs ;
- les caractères redondants.
- une matrice de connexité notée Ux telle que:
- αχ e Vχ χ / V = {0,l} ;
- Vz,y e {1...XJ, nous associons à toute liaison identifiée et notée L9 le nombre ^? = 1 , ou 0 s'il n'y a pas de liaison sachant que ^11 = 0 , V/ e {l ...x} ;
- Ux est une matrice carrée creuse symétrique dont la diagonale est toujours nulle.
Pour compléter notre démarche de réglementation de l'algorithme montant, nous devons considérer au moins trois chaînons de la chaîne KPI considérée. Aussi, soient deux autres chaînons V et 1W, ayant respectivement pour matrices de connexité : Vy et Wz. Nous considérons maintenant les deux opérations possibles au sein du réseau de Pétri.
Soit l'opération de redondance
- règle r1 :
V est induit et intègre (préalablement réalisé), ou élémentaire =^> Vy est connexe.
- règle r3 :
Z) respecte bien les contraintes issues des calculs de corrélation.
- règle r4 :
Ux est connexe =^> le graphe orienté de Ux est fortement connexe.
Soit l'opération de superposition Z) = [ V+ W ]L,j (commutative) :
- règle si :
- V est induit et intègre (préalablement réalisé), ou élémentaire ^> Vy est connexe ;
- 1W est induit et intègre (préalablement réalisé), ou élémentaire ^> Wz est connexe.
- règle s4 :
- règle s5 :
Ux est connexe ^> le graphe orienté de Ux est fortement connexe.
Afin de clarifier les règles de l'algorithme montant, voici une simulation construite sur la base d'une chaîne KPI fictive.
dont le graphe des liaisons par superposition peut être celui illustré à la figure 26. S'agissant d'une chaîne KPI, l'empilement des indicateurs élémentaires au sein de
5Wkpι- est linéaire comme illustré à la figure 27. La matrice descriptive et les connexités de cette chaîne KPI sont illustrées à la figure 28.
De ces trois représentations, nous pouvons décrire tous les chaînons qui sont nécessaires au bon déroulement de l'algorithme montant lors de la génération du réseau de Pétri :
On voit que le principe est le même que celui dit « des poupées russes ». Mais il est préférable d'anticiper l'utilisation informatique en donnant à ces écritures une forme générale qui utilise uniquement les identifiants des indicateurs de la chaîne
KPI. Voici donc une écriture plus appropriée à l'exploitation informatique :
Cette liste compte en tout 7 chaînons et n'est donc pas suffisante. Nous devons ajouter à cette liste 5 chaînons supplémentaires de type « singleton » puisqu'uniquement constitués des indicateurs élémentaires :
Ainsi, voici la liste ordonnée, selon l'algorithme montant, des opérations permettant de construire le réseau de Pétri de la chaîne KPI considérée :
Les chaînons des lignes relatives à Mi7 et Mi8 peuvent être réalisés simultanément.
Enfin, nous réécrivons maintenant l'ensemble de la chaîne KPI, ce qui revient à reconstituer entièrement « la poupée russe » :
Nous pouvons encore simplifier cette écriture en remplaçant les chaînons de type « singleton » par les indicateurs élémentaires. Voici donc l'écriture définitive ou code du réseau de Pétri de la chaîne KPI observée :
- ^kpι = [[I4 + I5 x I6 Vs + [/3 + [li+ h ]b ]/9 X Uo Vu X I12.
Ainsi, voici les trois états successifs par lesquels nous sommes passés lors du traitement des corrélations au sein de la chaîne KPI considérée :
- 5W|φι = V l ' J' 2 ' J' 3 ' ^4 ' J' 5 ' J' 6 ' J' 7 ' ^8 ' J' 9 ' J' l0 ' J' l l ' J' l2 / ',
- %p, = ((lι,I2,I3 ,I4,I5 ),(IτI9 >Iu >IMI6>Iw >In)) ;
- ^kpi = [[/4 + /5 X I6 V8 + [13 + [I1+ I2 Vi VQ X ho Vu X I12.
Voyons maintenant comment nous pouvons retrouver simplement le réseau de Pétri depuis la connaissance de la chaîne KPI.
L'état d'un KPI peut donc être modélisé par une arborescence de type réseau de Pétri dont chaque place représente un indicateur dans un état déterminé. En informatique, cette arborescence est codée sous forme d'une chaîne de symboles dite « bien parenthésée », où chaque symbole représente soit un indicateur soit une opération, et chaque niveau de parenthèse dans la chaîne représente une branche particulière du réseau de Pétri. Une chaîne « bien parenthésée » est telle que toute parenthèse ouverte est obligatoirement refermée à un autre endroit de la chaîne.
Dans le cas du KPI de l'exemple précédent, le réseau de Pétri permettant la modélisation de cet indicateur possède un code unique représenté par la chaîne suivante :
^kP, = [[/4 + I5 x I6 Vs + [/3 + [I1+ I2 ]h V9 x Iw V11 x I12.
On note que le code du réseau de Pétri peut évoluer au cours du temps.
Pour décrire cette chaîne, on utilise une grammaire formelle, aussi connue sous le nom de système de réécriture (une chaîne de caractère qui en remplace une autre). Pour cela, nous devons expliquer la sémantique ainsi trouvée, et nous donner des règles pour décrire toutes les opérations réalisées par les différents symboles de la chaîne lors d'une itération. L'application successive de ces règles à un symbole initial produit une séquence de transformation d'état. Ainsi pour chaque itération, l'état présent du réseau de Pétri est représenté par une chaîne de symboles issue de cette séquence.
L'état futur au pas d'itération suivant est calculé en transformant simultanément tous les symboles de l'état présent à l'aide des règles spécifiées par la grammaire suivante :
- définition des symboles propres à la chaîne réseau de Pétri :
- l'espace est muet ;
/, désigne un indicateur de la chaîne KPI ;
+ désigne une opération de superposition ;
x désigne une opération de redondance ;
[ désigne l'ouverture d'une superposition ;
- ] désigne la fermeture d'une superposition ;
U désigne une opération entre deux chaînons ;
((...);(...);(...)) désigne un chaînon ;
0 désigne l'absence d'information dans cette partie du chaînon.
- définition des règles ordonnées permettant l'évolution au pas d'itération suivant :
règle (a) : les indicateurs élémentaires présents dans la chaîne réseau de Pétri sont remplacés par les chaînons de type « singleton » ; les indicateurs élémentaires sont facilement identifiables puisque toujours placés après les symboles [ et +. Cette règle ne s'applique qu'une fois en début de traitement ;
I1 => ((/, )0;0)
règle (b) : le seuil de traitement de l'algorithme montant est mis à jour avant chaque itération en remplaçant tous les caractères redondants appliqués uniquement sur les indicateurs élémentaires ou intègres, par les opérations de redondance correspondantes. Les caractères redondants concernés sont représentés par x /, et sont toujours placés après le symbole ), la règle (a) ayant été réalisée préalablement à la règle (b) en début de traitement ;
règle (c) : à chaque itération depuis le seuil de traitement, nous réalisons toutes les liaisons d'indicateurs les plus encapsulées dans la chaîne réseau de Pétri en les remplaçant par les opérations de superposition correspondantes. Les liaisons d'indicateurs concernées sont représentées par l'enchaînement « bien parenthèse »
[...+...]/„ la règle (b) ayant toujours été réalisée préalablement à la règle (c) ;
[...+...]/, => ... u ... u (0;(^0)
règle (d) : c'est la règle des « poupées russes » dite aussi de simplification de l'écriture des chaînons. A la fin de chaque itération, les opérations de redondance
ou de superposition sont remplacées par les chaînons résultats. Les opérations concernées sont représentées par les enchainements de type ((I), (J}, (K)) U ((L), (M), (N)) pour la redondance ou
((/), (J); (K)) u ((L), (M), (N)) U ((O), (P), (Q)) pour la superposition ;
((I),(J),(K)M(L),(M),(N)) → ((I,L),(J,M),(K, N))
Appliquons ces règles de grammaire des graphes sur la chaîne réseau de Pétri obtenue lors de la simulation précédente :
^kP, = [[/4 + I5 x I6 Vs + [/3 + [I1+ h ]h ]h x Iw Vu x I12.
Les réécritures successives sont donc les suivantes:
Selon la règle (a):
Œ ((I4 ), 0; 0) + ((Z5 ); 0; 0) x ,. ]/β + 1 ((/3 ), 0; 0) + ( ((Z1 ), 0; 0) + ((Z2 ), 0; 0) ]h ]/β x ,„
Selon les règles (b)+(d):
Selon les règles (c)+(d):
[ ((i4 , 15 ), (h ), (h )) + [ ((/3 ); 0; 0) + ((I1 , h \ (h \ 0) μ. x /„ ]/« x /«
Selon les règles (c)+(d):
{((I4,I5),(IS),(I6)) + ((I1J2J3Ul1J9 )^) X I1O ]I11 X I12
Selon les règles (b)+(d):
[ ((I4 , 15 ), (I t ), (I6 )) + ((I1 J2 J3 ), (I1 , 19 }, (I10 )) ]/(, x ,„
Selon les règles (c)+(d):
Selon les règles (b)+(d):
((A J2 ,Z3Λ,Z5 );(/7,/9 Jn J&Uh Jm Jn))
Le réseau de Pétri correspondant à ce résultat est illustré à la figure 29.
Le fait de pouvoir représenter les chaînes KPI sous forme de réseau de Pétri présente donc deux gros avantages. Il permet le renforcement de la qualité des données au sein de l'entrepôt de données. Et il permet l'analyse quantitative des données grâce aux évolutions techniques qu'autorise ce type de représentation que ce soit en termes de réseau de Pétri dits temporises, interprétés, stochastiques, colorés, continus et/ou hybrides.
Ici la compréhension du modèle de circulation des marques au sein du réseau de Pétri retient notre attention. Ces marques sont la représentation des réalisations
ordonnées au sein du système observé. Les valeurs transportées par ces marques autorisent une lecture des distributions au sein du système d'information.
En outre, une telle représentation, combinée à des outils de type « files d'attente » trouve alors tout son sens.
Au sein d'une organisation telle qu'une société commerciale, le procédé qui vient d'être présenté peut être mis en œuvre avec les moyens illustrés à la figure 30.
Un dispositif 2 tel qu'un serveur est relié à au moins une base de données 4 d'un entrepôt de données (la base pouvant former ce dernier). La base contient les indicateurs relatifs à au moins un objet tel que l'organisation elle-même ou des activités de celle-ci, cet objet prenant plusieurs états (par exemple à des date successives), à chaque indicateur correspondant des valeurs associées aux états respectifs.
Le dispositif 2 comprend notamment une unité centrale et une mémoire formant des moyens aptes à identifier, comme expliqué plus haut, des corrélations entre au moins certains des indicateurs. On considérera ainsi par exemple trois indicateurs I1,
I2 et I3.
Les moyens sont aptes à former des groupes tels que des chaînes constitués chacun par un indicateur et des indicateurs corrélés à ce dernier et suffisant pour déduire ce dernier. Ici, on suppose que I1 et I2 induisent I3. Il s'agit donc du groupe [I1, I2, I3).
Les moyens sont aptes à construire le réseau de Pétri du groupe et à le coder au moyen de la grammaire comme indiqué plus haut.
Ces moyens sont aptes à associer, dans la base 4, à chacun des indicateurs I1,
I2 et I3 du groupe, dans un champs correspondant, une donnée M qui est la codification obtenue et qui indique une identité des autres indicateurs du groupe et leurs relations de cause à effet. On a aussi porté sur la figure 30 une autre donnée N relative à un autre groupe concernant I1 et I2 mais pas I3.
C'est ainsi que l'on constitue la base de données 4 puis qu'on la maintient à jour. En effet, lorsque de nouveaux indicateurs sont créés, des corrélations sont recherchées et la mise en œuvre du procédé enrichit la base.
L'exploitation de la base peut se faire comme suit.
On suppose qu'un opérateur tel qu'une personne consulte le dispositif 2 depuis son ordinateur 6 relié à un réseau de télécommunication 8 tel qu'internet ou un intranet, via un serveur 10 de l'organisation. Il souhaite par exemple connaitre une valeur récente de l'indicateur I1.
Le dispositif 2 identifie dans la base 4 les données M et N indiquant une identité des indicateurs I2 et I3 corrélés à l'indicateur consulté 11. Le dispositif déduit de la codification au moyen de la grammaire les relations de cause à effet entre les indicateurs du groupe M. Il fait de même avec ceux du groupe N. Le dispositif est aussi apte à exploiter ces identités, par exemple en transmettant ces identités au dispositif 10 chargé de construire et de modifier une page web 12 consultée par l'opérateur, afin que le dispositif 10 y fasse apparaître les identités des indicateurs identifiés et leurs relations.
L'opérateur est ainsi informé, après avoir consulté l'indicateur I1 sur la page, qu'il devrait aussi être attentif à la valeur des indicateurs I2 et /3qui lui sont corrélés.
On met donc en œuvre un procédé dans lequel:
- les moyens 2 identifient des corrélations entre au moins certains des indicateurs;
- les moyens 2 forment des groupes constitués chacun par un indicateur et des indicateurs corrélés à ce dernier et suffisant pour déduire ce dernier;
- les moyens associent, dans la base 4, à chacun des indicateurs du groupe, une donnée indiquant une identité des autres indicateurs du groupe.
Dans ce même procédé :
- les moyens identifient dans la base 4 au moins une donnée M et N indiquant une identité des indicateurs I2 et I3 corrélés à un indicateur consulté U et formant avec lui un groupe tel que les indicateurs du groupe, sauf un, suffisent pour déduire ce dernier, et
- les moyens exploitent les identités des indicateurs identifiés, par exemple en les transmettant sur le réseau 8.
Les dispositifs 2 et 10 comprennent un ou plusieurs programmes d'ordinateur comprenant des instructions de code apte à commander la mise en œuvre de certaines au moins des étapes du procédé lorsqu'il est exécuté sur un ordinateur.
On peut mettre ce programme sur un support d'enregistrement tel qu'un disque
DVD, un disque dur ou une mémoire flash. On peut mettre ce programme à disposition sur un réseau de télécommunication tel que le réseau 8 en vue de son téléchargement.
L'invention permet d'aller encore plus loin en réalisant une surveillance ou monitoring en trois dimensions des variables, comme nous allons maintenant le montrer.
On vient de voir que la CsKPI, ou codification significative des KPI, permet la construction de deux outils d'analyse et d'aide à la décision, à savoir la matrice
descriptive du système complexe observé et le makespan ou réseau de Pétri temporisé, formant un indicateur composite de robustesse.
Ces deux représentations permettent de produire l'attribut de la qualité des données de supervision, qui reste sans doute l'attribut le plus difficile à conceptualiser, à savoir l'intégrité, c'est-à-dire aussi l'authenticité et la traçabilité. La
CsKPI permet la supervision des points de fragilité du système complexe observé. Elle permet ainsi de localiser précisément des incidents, d'en suivre les propagations, les ricochets, mais aussi d'en mesurer avec précision les temps de propagation. Elle autorise enfin la simulation, la stimulation et l'optimisation du modèle de supervision.
Mais la CsKPI permet aussi de produire un autre outil d'analyse et d'aide à la décision qui est une surveillance en trois dimensions des variables. Cette surveillance permet d'évaluer la complétude d'un outil de supervision vis-à-vis du système complexe observé. La complétude est également l'un des attributs de la qualité des données de supervision, tels qui sont listés plus haut.
Nous allons donc décrire d'autres étapes du procédé dans lesquelles :
- on sélectionne l'une Io des variables et on place un vecteur correspondant à la variable;
- on sélectionne l'une U des variables qui lui est le plus étroitement corrélée et on place un vecteur correspondant à cette variable à une position représentant cette corrélation ;
- puis, autant de fois que nécessaire, on sélectionne l'une /, des variables qui est le plus étroitement corrélée à celles correspondant à un vecteur déjà positionné et on place un vecteur correspondant à cette variable à une position représentant cette corrélation,
les vecteurs étant positionnés avec leur origine au centre d'une sphère représentant l'objet et leur extrémité sur la sphère.
En effet, dans l'outil de surveillance des variables, le système complexe observé prend la forme d'une sphère et le système de supervision prend la forme d'un maillage, par exemple de type géodésique, qui s'enroule progressivement autour de la sphère.
On rappelle qu'il est possible de représenter les variables présentes au sein de l'entrepôt de données de l'entreprise sous forme de vecteurs d'observations variables au cours du temps. Ces vecteurs sont positionnés les uns par rapport aux autres à l'aide des coefficients de corrélation mathématique qui sont ici les cosinus directeurs des vecteurs d'observations construits deux à deux.
En réalité, cette construction devrait être hypersphérique compte tenu du fait que nous travaillons dans un espace euclidien de dimension équivalente au cardinal de l'entrepôt de données, à savoir le nombre de variables de supervision. Pour des raisons techniques, nous choisissons en l'espèce d'aplatir cette hypersphère afin de travailler uniquement dans un espace à trois dimensions.
Nous allons expliquer le calcul des coordonnées des vecteurs et rappeler tout d'abord les relations de trigonométrie « sphérique ».
Soit un repère orthonormé direct Oxyz. Un triangle sphérique est la plus petite portion d'une sphère limitée par trois grands cercles centrés en O, le centre de la sphère, et ayant même rayon que celui de la sphère. Les côtés de ce triangle sont des courbes dont les prolongements sont des cercles de même rayon que celui de la sphère, comme illustré à la figure 31. Les trois points A, B, C sur la sphère délimitent le triangle « sphérique ».
La figure illustre la sphère dans sa configuration initiale : B est au pôle situé sur l'axe z, A est l'un des points d'intersection de la sphère avec le plan passant par les axes z et x.
Les sommets du triangle sont notés A, B et C. Ainsi l'angle ABC est noté B, CAB est noté A, etc.. Le coté opposé à un angle a la même dénomination que celui-ci mais en minuscule. Le côté BC est ainsi nommé a.
S'agissant d'une sphère de rayon 1 , nous pouvons confondre un côté et un angle, ainsi BC = a = rayon BOC = BOC (abscisse curviligne) dès lors que BOC est inférieur à 1J/6. Cela peut se démontrer facilement par le biais du développement limité de Taylor pour la fonction sinus à l'ordre 2 :
osm(*2) ≈ o
d'où v«co,§]
Mais l'angle A est différent de a et ainsi de suite.
Pour faciliter les calculs, nous parlons donc en radians fl| rad = 180°). Notre but est de calculer les coordonnées x, y, z de C, un point quelconque de la sphère. Nous les calculons ensuite depuis un repère différent. Ces relations doivent être celles de la trigonométrie « sphérique ».
Dans la suite, on utilise deux figures correspondant à deux projections. Cela nous permet d'avoir les coordonnées en z et en y sur la figure 32, et en x sur la figure
33. Ces projections ne changent pas les valeurs des angles A, B, C, a, b et c, ou tout du moins de manière très négligeable tant que les valeurs de a, b et c restent inférieures à 1J/6 et que le point B reste au pôle.
On fait remarquer au passage que cos(1J/6) vaut à peu près 0,866 et correspond aussi au seuil des corrélations mathématiques dites remarquables au sens de la matrice descriptive.
A étant un point sur la sphère et dans le plan zOx, la projection de C sur le plan xOy est nommée C Pour trouver les coordonnées x et y, nous devons d'abord trouver la valeur de OC. Cela revient à réaliser un calcul de trigonométrie normale depuis les schémas des figures 2 et 3.
La figure 32 nous montre un simple triangle à l'issue de la projection. Toutefois, la projection de la figure 2 n'est pas tout à fait exacte. En fait, ce n'est pas le plan yOz, mais le plan COB, ce qui n'influe en rien sur les calculs compte tenu des hypothèses sur les angles.
Les formules de z et OC sont donc:
z = sin (COC) = sin fl|/2 - a) = cos a
OC = cos (COC) = cos (11/2 - a) = sin a
Pour les coordonnées de C, nous devons calculer les coordonnées de C dans le plan xOy. Sachant que la longueur de l'hypoténuse est sin a, nous en déduisons les coordonnées du point C :
x = OC cos ( ABC ) = sin a cos B
y = OC sin ( ABC ) = sin a sin B (1 ) z = cos a
Nous réalisons ensuite un changement de base de sorte que ce soit A qui devienne le pôle par une rotation d'axe Oy, comme illustré à la figure 34.
Nous avons un nouveau repère orthonormé direct Ox'y'z'. Les figures 35 et 36 montrent les coordonnées y et z de C dans le nouveau repère, qui s'expriment comme suit:
z' = sin (COC) = sin fl|/2 - b) = cos b
OC = cos (COC) = cos flJ/2 - b) = sin b
Le point A à la figure 35 n'étant pas du même côté que le point B à la figure 36, nous devons utiliser les cos ou sin ( U - A ). D'où les relations suivantes :
x' = OC cos (XAC) = sin b cos (H - A) = - sin b cos A y' = OC sin (XAC) = sin b sin (H - A) = sin b sin A (2) z' = cos b
Pour établir les relations de trigonométrie sphériques, nous utilisons les relations de changement de repère suivantes :
x = x' cos c + z' sin c
y = y'
z = z' cos c - x' sin c
A partir de (1 ) et (2) et en remplaçant x', y' et z' dans les formules de changement de base, on obtient :
x = cos b sin c - sin b cos c cos A
y = sin b sin A
z = cos b cos c + sin b sin c cos A
Les formules de trigonométrie « sphérique » sont obtenues en remplaçant maintenant x, y et z :
sin a cos B = cos b sin c - sin b cos c cos A
sin a sin B = sin b sin A (3) cos a = cos b cos c + sin b sin c cos A
Pour le calcul des coordonnées des vecteurs, il s'agit d'abord de localiser les variables corrélées à une variable de référence notée I1 et qui a été préalablement sélectionnée par l'utilisateur. L'ordonnancement des variables doit tenir compte de la CsKPI correspondante.
Les vecteurs utilisés ont tous pour point d'origine le centre de la sphère en
(0,0, 0)0 dans la base que nous notons {0,X0,Yo,Z0}, alors que leurs extrémités sont toutes situées à la surface de la sphère préalablement tracée.
Nous appliquons une méthode de triangulation. Nous plaçons un premier vecteur noté I0 , puis le vecteur noté I1 correspondant à la variable qui lui est la plus fortement corrélée positivement au sens de la CsKPI. Puis nous déduisons I2 par le biais du calcul. Ce troisième vecteur est lui aussi choisi par rapport à son fort niveau de corrélation au sens de la CsKPI et il doit être placé en fonction des deux autres vecteurs déjà positionnés selon une rotation antihoraire autour de I0 .
S'ensuit un changement de repère. En effet, la modification du pôle de /, vers /(ï+i) permet de répéter la méthode de triangulation autant de fois que nécessaire tout en respectant les hypothèses de la trigonométrie « sphérique », à savoir des angles toujours compris entre 0 et 1J/6.
Avec ce système, les points correspondant aux variables de supervision se dessinent progressivement autour de la sphère à la façon d'une pelure de pomme comme illustré à la figure 37.
Le premier vecteur I0 est positionné sur l'axe des Z du repère orthonormé de la figure 38. La sphère possédant un rayon de 1 , le premier vecteur a une norme de 1 avec les coordonnées cartésiennes (0,0,1 ). Ce vecteur constitue donc le premier pôle de notre construction. Le vecteur I1 représente la variable la plus fortement corrélée positivement au sens de la CsKPI par rapport à la variable de référence, et pour simplifier le calcul de ses coordonnées, nous plaçons son extrémité sur le plan xOz.
Nous pouvons alors poser le problème depuis le cercle trigonométrique de la figure 39. αOi est l'angle séparant les deux vecteurs et le cosinus de cet angle est en réalité le cosinus directeur ou le coefficient de corrélation contenu dans la matrice des corrélations.
Nous en déduisons les coordonnées cartésiennes du vecteur /, :
Fp01 est le cosinus directeur contenu dans la matrice des corrélations, positif et compris dans l'intervalle [0.866 , 1]. Ce doit être une corrélation remarquable au sens de la matrice descriptive.
Le troisième vecteur I2 représente la variable la plus fortement corrélée positivement au sens de la CsKPI, et ce respectivement par rapport à I0 et I1 . C'est ici qu'intervient la méthode de triangulation. Le placement de I2 est fait à partir des positions de I0 et I1 comme illustré à la figure 40.
Pour le calcul de I2 , les relations de trigonométrie « sphérique » précitées sont utilisées :
II ne reste plus qu'à utiliser l'ensemble des cosinus directeurs liés à αoi , αo2 αi2 depuis la matrice des corrélations, comme illustré à la figure 41.
Le cosinus de l'angle αoi qui sépare les vecteurs ^0 et I1 est donc situé dans la matrice des corrélations dans la case correspondant aux deux variables associées. Il doit être positif et compris dans l'intervalle [0.866 , 1]. Ce doit être une corrélation remarquable au sens de la matrice descriptive.
Nous notons cette valeur r Pm , sachant que par définition, Pm Pw .Nous faisons de même pour chacun des angles directeurs concernés.
Cela nous permet d'écrire les coordonnées cartésiennes du vecteur I2 , exprimées dans la base d'origine {0,X0,Yo,Z0}, de la façon suivante :
Avant de positionner les vecteurs suivants, un changement de base doit être effectué. En effet, jusqu'à présent, nous avions pour pôle le vecteur origine ^0 - Nous devons désormais basculer le pôle sur le vecteur I1 . Une modification du repère apparaît et il faut alors utiliser les matrices de passage successives pour continuer à exprimer les coordonnées des vecteurs par rapport à la base d'origine {O,X0,Y0,Z0}.
La nouvelle base se note alors (0,X11Y11Z1J et la méthode de triangulation s'opère désormais sur les variables h , I2 et I3 , comme illustré à la figure 42.
Plus généralement, nous effectuons un changement de pôle de /, vers I(ι+i) pour placer ^+3) et ce dernier est alors exprimé dans un premier temps dans la nouvelle base {O,
»^(:+I) } avant d'être exprimé dans la base {0,X0,Yo,Z0}.
Après calcul, nous pouvons écrire les coordonnées de qui sont exprimées dans la nouvelle base (0,X11Y11Z1J : . Nous effectuons alors le même calcul que pour le placement de I2 et nous trouvons les coordonnées cartésiennes du vecteur I3 simplement en remplaçant les indices :
Pour exprimer le vecteur I3 dans notre base d'origine (O1Xo1Yo1Z0J1 nous utilisons la matrice de passage P1 qui est constituée des vecteurs unitaires de (O1X11Y11Z1J exprimés dans la base d'origine (O1Xo1Yo1Z0J.
Nous exprimons alors dans la base d'origine de la façon suivante :
Pour le positionnement du vecteur I1 , après une recherche de récurrence depuis les formules de positionnement des vecteurs, nous déduisons que, pour tout
1 - 3 , les coordonnées cartésiennes du vecteur /, sont :
II est entendu que ces coordonnées ne sont pas encore exprimées dans la base d'origine.
Il est indispensable d'utiliser des matrices de passage successives pour retrouver les coordonnées de nos vecteurs successifs I1 dans la base d'origine
{0,Xo,Yo,Z0}. Il s'agit donc de déterminer les coordonnées de la nouvelle base {O,
dans la base d'origine {0,X0,Yo,Z0}. Pour ce faire, on procède par récurrence. P1 étant la première matrice de passage rencontrée, nous devons l'utiliser comme amorce de notre récurrence pour le cas où ι ' = 3 . P1 correspond donc à la matrice de passage depuis la base {0,X0,Yo,Z0} vers la base (0,X11Y11Z1J.
Voici le premier vecteur de cette base que nous pouvons déduire facilement :
Le troisième vecteur de cette base se déduit du produit vectoriel suivant
Nous en déduisons la matrice de passage correspondante :
Nous pouvons ainsi déduire facilement la formule de récurrence pour le cas *'≥ 3 et /, exprimé dans la base d'origine:
Cette formulation produit donc les règles de construction de l'outil complémentaire permettant la surveillance en trois dimensions des variables.
Comme illustré aux figures 43 et 44, on construit une ligne brisée 14 à la surface de la sphère 16 en reliant les unes aux autres les extrémités des vecteurs par ordre de construction de ceux-ci.
La figure 43 est une représentation en mode non alterné ou géodésique. Pour l'obtenir, le signe de l'ordonnée de chaque vecteur d'observation est forcé à « + ».
Les mêmes variables sont illustrées sur la sphère à la figure 44 en mode dit alterné. Cette représentation en trois dimensions de type "pelure" correspond à la situation dans laquelle le signe de l'ordonnée de chaque vecteur d'observation est alterné à « + » ou « - ». Cette ligne forme la « pelure » précitée. Une fois obtenue, si la « pelure » du système complexe observé recouvre intégralement la sphère qui représente le système lui-même, la complétude du gisement des variables de supervision est à son tour vérifiée. Plus généralement, si la couverture n'est pas intégrale, on peut dire tout de même que plus la sphère est recouverte, plus le système de variables est pertinent.
D'une manière générale, l'affichage de type "pelure" permet d'évaluer la complétude du système de supervision, alors que l'affichage de type "géodésique" permet d'évaluer la répartition homogène des variables autour du système observé.
A ce stade, l'évaluation reste une démarche essentiellement visuelle.
Toutes les opérations de construction des représentations peuvent être avantageusement effectuées par le dispositif automatisé précité.
Bien entendu, on pourra apporter à l'invention de nombreuses modifications sans sortir du cadre de celle-ci.
On pourra effectuer la représentation offrant une supervision en trois dimensions au moyen du positionnement des vecteurs sur la sphère sans former des groupes constitués chacun par une des variables et d'autres des variables corrélées à cette dernière et suffisant pour déduire cette dernière, ni même associer, dans une base de données, à chacune des variables du groupe, une donnée indiquant au moins une identité des autres variables du groupe.
Claims
1. Procédé pour organiser une base de données (4) comprenant des variables, telles que des indicateurs (U, I2, h), relatives à un objet prenant plusieurs états, à chaque variable correspondant des valeurs associées aux états respectifs, le procédé étant caractérisé en ce que :
- des moyens automatisés (2) identifient des corrélations entre au moins certaines des variables;
- les moyens (2) forment des groupes constitués chacun par une des variables (/3) et d'autres [I1, I2) des variables corrélées à cette dernière et suffisant pour déduire cette dernière; et
- les moyens (2) associent, dans une base de données (4), à chacune des variables du groupe, une donnée (M) indiquant au moins une identité des autres variables du groupe.
2. Procédé selon la revendication précédente dans lequel les moyens (2) construisent un graphe, tel qu'un réseau de Pétri, du groupe, par exemple au moyen d'un algorithme montant.
3. Procédé selon la revendication précédente dans lequel les moyens (2) codent le graphe pour produire la donnée (M).
4. Procédé selon au moins l'une quelconque des revendications précédentes dans lequel :
- on sélectionne une (lo) des variables et on place un vecteur correspondant à la variable;
- on sélectionne une (U) des variables qui lui est le plus étroitement corrélée et on place un vecteur correspondant à cette variable à une position représentant cette corrélation ;
- puis, autant de fois que nécessaire, on sélectionne une (/,) des variables qui est le plus étroitement corrélée à celles correspondant à un vecteur déjà positionné et on place un vecteur correspondant à cette variable à une position représentant cette corrélation,
les vecteurs étant positionnés avec leur origine au centre d'une sphère représentant l'objet et leur extrémité sur la sphère.
5. Procédé pour exploiter des variables, telles que des indicateurs [I1, I2, I3), relatives à un objet prenant plusieurs états, à chaque variable correspondant des valeurs associées aux états respectifs, le procédé étant caractérisé en ce que ; - des moyens automatisés (2) obtiennent dans une base de données au moins une donnée (M) indiquant une identité (I2, I3) de variables corrélées à une variable prédéterminée (I1) et formant avec elle un groupe tel que les variables du groupe, sauf une (/3), suffisent pour déduire cette dernière, les moyens identifiant ainsi les variables corrélées ; et
- les moyens (2) exploitent les identités des variables identifiées, par exemple les transmettent sur un réseau de télécommunication (8).
6. Procédé selon la revendication précédente dans lequel les moyens (2) identifient à partir de la donnée des relations de cause à effet entre les variables (I1, I2, I3) du groupe.
7. Procédé selon l'une quelconque des revendications 4 et 5, dans lequel les moyens (2) commandent la mention sur une page web (6) des identités des variables identifiées.
8. Programme d'ordinateur caractérisé en ce qu'il comprend des instructions de code apte à commander la mise en œuvre d'un procédé selon l'une quelconque des revendications précédentes lorsqu'il est exécuté sur un ordinateur.
9. Dispositif (2) pour organiser une base de données (4) comprenant des variables [I1, I2, I3), telles que des indicateurs, relatives à un objet prenant plusieurs états, à chaque variable correspondant des valeurs associées aux états respectifs, le dispositif comprenant des moyens aptes:
- à identifier des corrélations entre au moins certaines des variables (I1, I2, 13);
- à former des groupes constitués chacun par une (/3) des variables et d'autres (U, I2) des variables corrélées à cette dernière et suffisant pour déduire cette dernière; et
- à associer, dans une base de données (4), à chacune des variables du groupe, une donnée (M) indiquant au moins une identité des autres variables du groupe.
10. Dispositif (2) d'exploitation de variables (I1, I2, I3), telles que des indicateurs, relatives à un objet prenant plusieurs états, à chaque variable correspondant des valeurs associées aux états respectifs, le dispositif, éventuellement selon la revendication précédente, étant caractérisé en ce qu'il comprend des moyens aptes ;
- à obtenir dans une base de données (4) au moins une donnée (M) indiquant une identité (I2, I3) de variables corrélées à une variable prédéterminée (I1) et formant avec elle un groupe tel que les variables du groupe, sauf une (/3), suffisent pour déduire cette dernière, les moyens étant aptes ainsi à identifier les variables corrélées ; et - à exploiter les identités des variables identifiées, par exemple à les transmettre sur un réseau de télécommunication (8).
11. Base de données (4) caractérisée en ce qu'elle comprend :
- des variables (U, I2, h) relatives à un objet prenant plusieurs états, à chaque variable correspondant des valeurs associées aux états respectifs;
- au moins une donnée (M) en relation avec au moins une des variables et indiquant une identité de certaines des variables corrélées avec elle et formant avec elle un groupe tel que les variables du groupe, sauf une (/3), suffisent pour déduire cette dernière.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP10762959A EP2471010A2 (fr) | 2009-08-25 | 2010-07-30 | Procede pour organiser des variables dans une base de donnees |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR0955787 | 2009-08-25 | ||
| FR0955787A FR2949585B1 (fr) | 2009-08-25 | 2009-08-25 | Procede pour organiser des variables dans une base de donnees |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| WO2011023876A2 true WO2011023876A2 (fr) | 2011-03-03 |
| WO2011023876A3 WO2011023876A3 (fr) | 2011-07-07 |
Family
ID=41802250
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/FR2010/051632 Ceased WO2011023876A2 (fr) | 2009-08-25 | 2010-07-30 | Procede pour organiser des variables dans une base de donnees |
Country Status (3)
| Country | Link |
|---|---|
| EP (1) | EP2471010A2 (fr) |
| FR (1) | FR2949585B1 (fr) |
| WO (1) | WO2011023876A2 (fr) |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20020174087A1 (en) * | 2001-05-02 | 2002-11-21 | Hao Ming C. | Method and system for web-based visualization of directed association and frequent item sets in large volumes of transaction data |
| US6937238B2 (en) * | 2003-03-20 | 2005-08-30 | Hewlett-Packard Development Company, L.P. | System for visualizing massive web transaction data sets without overlapping |
| WO2006028154A1 (fr) * | 2004-09-09 | 2006-03-16 | Kyoto University | Système de gestion d’information, méthode de gestion d’information, programme de gestion d’information et support d’enregistrement |
| US8010589B2 (en) * | 2007-02-20 | 2011-08-30 | Xerox Corporation | Semi-automatic system with an iterative learning method for uncovering the leading indicators in business processes |
| US8122123B2 (en) * | 2007-02-23 | 2012-02-21 | International Business Machines Corporation | System and method for monitoring business performance using monitoring artifacts |
-
2009
- 2009-08-25 FR FR0955787A patent/FR2949585B1/fr active Active
-
2010
- 2010-07-30 WO PCT/FR2010/051632 patent/WO2011023876A2/fr not_active Ceased
- 2010-07-30 EP EP10762959A patent/EP2471010A2/fr not_active Withdrawn
Non-Patent Citations (1)
| Title |
|---|
| None |
Also Published As
| Publication number | Publication date |
|---|---|
| EP2471010A2 (fr) | 2012-07-04 |
| FR2949585A1 (fr) | 2011-03-04 |
| FR2949585B1 (fr) | 2011-10-21 |
| WO2011023876A3 (fr) | 2011-07-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Mehtab et al. | Stock price prediction using CNN and LSTM-based deep learning models | |
| CN113705864A (zh) | 基于VMD-CNN-BiLSTM-ATT混合模型的气象干旱预测方法及装置 | |
| Piergiovanni et al. | Adversarial generative grammars for human activity prediction | |
| Ali et al. | A data selection methodology to train linear regression model to predict bitcoin price | |
| Abbasi et al. | A system dynamics model for mobile banking adoption | |
| Calinescu et al. | Efficient parametric model checking using domain knowledge | |
| CA2370693C (fr) | Systeme et methode de pilotage d'un processus decisionnel lors de la poursuite d'un but globale dans un domaine d'application determine | |
| Liu et al. | Classical simulation of quantum circuits: Parallel environments and benchmark | |
| Mullick et al. | Sociophysics models inspired by the Ising model | |
| Zaiou | Quantum machine learning approaches for graphs and sequences: application to nuclear safety assessment | |
| Fang et al. | Oat: Object-level attention transformer for gaze scanpath prediction | |
| FR3104768A1 (fr) | Systeme et methode d’exploitation d’un contexte d’evenements historiques pour l’amelioration du gestionnaire de dialogue d’un chatbot | |
| Jo et al. | A new approach to the BDI agent-based modeling | |
| Bansod | Distinguishing autonomous AI agents from collaborative agentic systems: A comprehensive framework for understanding modern intelligent architectures | |
| EP2471010A2 (fr) | Procede pour organiser des variables dans une base de donnees | |
| Mazumder et al. | A framework for trustworthy AI in credit risk management: perspectives and practices | |
| Pouplin et al. | The Synergy of LLMs & RL Unlocks Offline Learning of Generalizable Language-Conditioned Policies with Low-fidelity Data | |
| CN113672741B (zh) | 一种信息的处理方法、装置及设备 | |
| Wiesmüller et al. | Governance of collaborative AI development strategies | |
| Piperno et al. | Quantum simplicial neural networks | |
| CN115439218A (zh) | 目标用户确定方法以及装置 | |
| EP3622445B1 (fr) | Procede, mise en oeuvre par ordinateur, de recherche de regles d'association dans une base de donnees | |
| Huerta-Ruiz et al. | Quantum coherence and counterdiabatic quantum computing | |
| Geyda | Toward the theory of using information for actions in systems: Prospects for research and reviews | |
| KR102932625B1 (ko) | 모달리티 편향을 제거한 멀티모달 감정 인식 방법 및 그 장치 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 10762959 Country of ref document: EP Kind code of ref document: A2 |
|
| REEP | Request for entry into the european phase |
Ref document number: 2010762959 Country of ref document: EP |
|
| WWE | Wipo information: entry into national phase |
Ref document number: 2010762959 Country of ref document: EP |
|
| NENP | Non-entry into the national phase |
Ref country code: DE |






















