EP2680158A2 - Method for determining a missing value among data collected for a plurality of individuals at a plurality of times - Google Patents

Method for determining a missing value among data collected for a plurality of individuals at a plurality of times Download PDF

Info

Publication number
EP2680158A2
EP2680158A2 EP13170953.7A EP13170953A EP2680158A2 EP 2680158 A2 EP2680158 A2 EP 2680158A2 EP 13170953 A EP13170953 A EP 13170953A EP 2680158 A2 EP2680158 A2 EP 2680158A2
Authority
EP
European Patent Office
Prior art keywords
estimator
dynamic
given
individual
static
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP13170953.7A
Other languages
German (de)
French (fr)
Other versions
EP2680158A3 (en
Inventor
Anne De Moliner Dumont
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electricite de France SA
Original Assignee
Electricite de France SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electricite de France SA filed Critical Electricite de France SA
Publication of EP2680158A2 publication Critical patent/EP2680158A2/en
Publication of EP2680158A3 publication Critical patent/EP2680158A3/en
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q9/00Arrangements in telecontrol or telemetry systems for selectively calling a substation from a main station, in which substation desired apparatus is selected for applying a control signal thereto or for obtaining measured values therefrom
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01DMEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
    • G01D4/00Tariff metering apparatus
    • G01D4/002Remote reading of utility meters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q2209/00Arrangements in telecontrol or telemetry systems
    • H04Q2209/60Arrangements in telecontrol or telemetry systems for transmitting utility meters data, i.e. transmission of data from the reader of the utility meter

Abstract

The method involves calculating a dynamic estimator of a missing value from values collected for a given individual (i) at a given instant (t) and a preceding instant. A static estimator of the missing value is calculated from the values collected for individuals at a given instant. A combined estimator of the missing value is determined from the static estimator and the dynamic estimator, where the dynamic estimator is calculated according to the length of a successive series of missing values and the location of the missing value in the series.

Description

L'invention concerne la correction des valeurs manquantes dans des courbes de charge, notamment dans le domaine des données de consommation électrique collectées auprès d'individus consommateurs d'électricité, mais également dans le domaine des données de consommation en gaz naturel ou en eau.The invention relates to the correction of the missing values in load curves, in particular in the field of power consumption data collected from electricity consuming individuals, but also in the field of consumption data for natural gas or water.

Récemment, les dispositifs d'acquisition de données installés par les fournisseurs de services électriques permettent de communiquer des données relatives à la consommation de l'individu alimenté en énergie électrique. Avec de tels systèmes, la quantité de courbes de charge disponibles va considérablement s'accroître pour le fournisseur. Il pourrait alors être envisageable d'utiliser des techniques d'échantillonnage pour estimer la consommation totale instantanée à chaque pas, par exemple demi-horaire, au périmètre d'un groupe de clients.Recently, the data acquisition devices installed by the electrical service providers make it possible to communicate data relating to the consumption of the individual supplied with electrical energy. With such systems, the amount of load curves available will increase considerably for the supplier. It may then be possible to use sampling techniques to estimate the instantaneous total consumption at each step, for example half-hour, at the perimeter of a group of customers.

Par exemple, il est connu d'installer un système distribué de gestion pour superviser le fonctionnement de dispositifs d'acquisition de données installés par exemple chez chaque particulier ou entreprise. Chaque système de gestion est un ordinateur qui régit le fonctionnement des dispositifs d'acquisition de données. Chaque dispositif d'acquisition de données comprend de nombreux capteurs propres à surveiller la consommation de chaque particulier ou entreprise, éventuellement de chaque équipement de chaque particulier ou entreprise. Par exemple, le système de gestion peut être relié à des compteurs individuels pour l'électricité, le gaz, l'eau et autres.For example, it is known to install a distributed management system to supervise the operation of data acquisition devices installed for example at each individual or company. Each management system is a computer that governs the operation of the data acquisition devices. Each data acquisition device includes many sensors adapted to monitor the consumption of each individual or company, possibly each equipment of each individual or company. For example, the management system can be linked to individual meters for electricity, gas, water and others.

Périodiquement, chaque système de gestion collecte des données de consommation via les différents capteurs et stockent ces données dans leur support de mémorisation. La fréquence à laquelle les données sont collectées est déterminée par exemple par le fournisseur de services. En général, la consommation des équipements de fonctionnement relativement stable peuvent être échantillonnés moins fréquemment, par rapport à un équipement ayant de grandes variations de consommation.Periodically, each management system collects consumption data via the various sensors and stores this data in their storage medium. The frequency with which the data are collected is determined for example by the service provider. In general, relatively stable operation equipment consumption may be sampled less frequently, compared to equipment with large consumption variations.

Les données collectées peuvent être analysées localement par le système de gestion ou être transmis via une liaison de communication pour analyse par un serveur central du fournisseur de services. La liaison de communication peut par exemple être de type Internet et/ou inclure des connexions sans fil. Le serveur central appartient par exemple à un fournisseur d'énergie électrique et recueille les données de consommation électriques transmises depuis une pluralité de systèmes de gestion.The collected data can be analyzed locally by the management system or transmitted via a communication link for analysis by a central server of the service provider. The communication link may for example be of the Internet type and / or include wireless connections. The central server belongs for example to an electric power supplier and collects the electrical consumption data transmitted from a plurality of management systems.

Comme tout processus industriel de masse, la collecte des données est susceptible de subir toutes sortes d'aléas techniques le long de la chaîne de mesure et de remontée d'information. Les données pourraient ainsi contenir des valeurs manquantes. Ces données manquantes peuvent être assimilées à un problème de « non réponse » en sondages. Un traitement de cette non réponse sera nécessaire, afin d'une part de limiter au maximum la perte de précision due à l'absence de certaines données et d'autre part d'éviter les biais (c'est-à-dire les erreurs systématiques) sur l'estimation du total dus à d'éventuelles différences entre la population globale et les individus sans valeurs manquantes.Like any mass industrial process, data collection is susceptible to all kinds of technical hazards along the chain of measurement and feedback. The data could thus contain missing values. These missing data can be likened to a "no answer" problem in polls. A treatment of this non-response will be necessary, on the one hand to limit as much as possible the loss of precision due to the absence of certain data and on the other hand to avoid bias (ie errors systematic) on the estimation of the total due to possible differences between the global population and individuals without missing values.

Les méthodes existantes de correction d'une « non réponse » peuvent être classées en deux catégories ; d'une part les méthodes dites « statiques » et d'autre part les méthodes dites « dynamiques ».Existing methods of correcting a "no answer" can be classified into two categories; on the one hand so-called "static" methods and on the other hand so-called "dynamic" methods.

Les méthodes statiques, issues de la théorie des sondages, consistent à traiter la non réponse instant par instant à partir des autres individus présents au moment considéré et de l'information auxiliaire. La valeur manquante peut alors être imputée par régression, par le ratio, par la moyenne de classe, par le « hot-deck », accompagnée de méthodes de pondération. Ce sont les méthodes classiques utilisées en statistique d'enquête. Elles sont décrites par exemple dans l'ouvrage de P. Ardilly, « Techniques de sondages », paru aux éditions Technip en 2006 . Pour ces méthodes, le biais sur l'estimateur du total est nul à tout instant, et la variance peut être estimée sous certaines conditions sur le plan de sondage.The static methods, derived from the theory of the surveys, consist in treating the nonresponse instant by moment from the other individuals present at the moment considered and the auxiliary information. The missing value can then be imputed by regression, by the ratio, by the class average, by the "hot deck", accompanied by weighting methods. These are the classical methods used in survey statistics. They are described for example in the book P. Ardilly, "Survey techniques", published by Technip in 2006 . For these methods, the bias on the total estimator is zero at any given time, and the variance can be estimated under certain design conditions.

Les méthodes dynamiques, issues des séries temporelles, corrigent la valeur manquante à partir des consommations du même individu à d'autres dates. La valeur manquante peut alors être imputée par interpolation linéaire, lissage exponentiel, ou autre. Ces méthodes fournissent des courbes cohérentes au niveau individuel. Cependant, pour ces méthodes, les biais instantanés sur l'estimation du total ne sont pas nuls, et il n'existe pas d'estimateur explicite de la variance. La publication de R.T. Clemen, "Combining forecasts: A review and annotated bibliography", International Journal of Forecasting 559-583, 1989 , décrit l'utilisation de plusieurs estimateurs dynamiques mais sans problématique d'échantillonnage et ne fait pas intervenir d'estimateurs statiques.Dynamic methods, derived from time series, correct the missing value from consumptions of the same individual at other dates. The missing value can then be imputed by linear interpolation, exponential smoothing, or other. These methods provide consistent curves at the individual level. However, for these methods, the instantaneous biases on the total estimate are not zero, and there is no explicit variance estimator. The publication of RT Clemen, "Combining forecasts: A review and annotated bibliography", International Journal of Forecasting 559-583, 1989 , describes the use of several dynamic estimators but without sampling problems and does not involve static estimators.

Toutes ces méthodes, statiques et dynamiques, ont l'inconvénient de laisser de côté une partie de l'information disponible (le reste de la courbe de l'individu pour les estimateurs statiques et la consommation des autres individus au même instant pour les méthodes dynamiques). En outre, il est à noter que, du seul fait de la quantité conséquente de données collectées à traiter, toutes ces méthodes sont préférentiellement, voire incontournablement, mises en oeuvre par ordinateur, que ce soit au niveau de chaque système de gestion ou au niveau du serveur central du fournisseur de services.All these methods, static and dynamic, have the disadvantage of leaving aside some of the information available (the rest of the curve of the individual for static estimators and the consumption of other individuals at the same time for dynamic methods ). In addition, it should be noted that, because of the large amount of data collected to be processed, all these methods are preferentially, if not inevitably, implemented by computer, whether at the level of each management system or at the level of the data collected. the central server of the service provider.

Il existe donc un besoin pour une méthode permettant d'imputer les valeurs manquantes, c'est-à-dire de remplacer chacune d'entre elles par une valeur « crédible » calculée à partir du reste de la base de données, de manière à obtenir la meilleure précision possible sur l'estimation du total.There is therefore a need for a method to impute missing values, that is, to replace each of them with a "credible" value calculated from the rest of the database, so as to obtain the best possible precision on the total estimate.

A cet effet, l'invention propose une méthode permettant de combiner un ou plusieurs estimateurs statiques et un ou plusieurs estimateurs dynamiques pour maximiser l'utilisation de l'information et donc améliorer la précision de l'estimateur final.For this purpose, the invention proposes a method for combining one or more static estimators and one or more dynamic estimators to maximize the use of the information and thus improve the accuracy of the final estimator.

Plus particulièrement, l'invention concerne un procédé de détermination d'une valeur manquante parmi des données collectées pour une pluralité d'individus à une pluralité d'instants, la valeur manquante étant associée à un individu i donné non répondant à un instant t donné, le procédé comprenant les étapes de :

  • calcul d'un estimateur dynamique y ^ i , t , c d
    Figure imgb0001
    de la valeur manquante à partir de valeurs collectées pour l'individu donné à des instants précédents et suivants l'instant donné ;
  • calcul d'un estimateur statique y ^ i , t s
    Figure imgb0002
    de la valeur manquante à partir de valeurs relatives à des individus répondants à l'instant donné ;
  • détermination d'un estimateur combiné y ^ i , t γ
    Figure imgb0003
    de la valeur manquante à partir de l'estimateur statique y ^ i , t s
    Figure imgb0004
    et de l'estimateur dynamique y ^ i , t d .
    Figure imgb0005
More particularly, the invention relates to a method for determining a missing value among data collected for a plurality of individuals at a plurality of times, the missing value being associated with a given individual i not responding at a given time t the method comprising the steps of:
  • calculating a dynamic estimator there ^ i , t , vs d
    Figure imgb0001
    the missing value from values collected for the given individual at previous times and following the given moment;
  • calculation of a static estimator there ^ i , t s
    Figure imgb0002
    the missing value from values relating to individuals responding at the given moment;
  • determination of a combined estimator there ^ i , t γ
    Figure imgb0003
    the missing value from the static estimator there ^ i , t s
    Figure imgb0004
    and the dynamic estimator there ^ i , t d .
    Figure imgb0005

La méthode selon l'invention permet ainsi avantageusement d'estimer au moins une valeur manquante parmi les valeurs collectées et d'obtenir ainsi un ensemble de valeurs comprenant à la fois les valeurs collectées et au moins une valeur estimée, donc un ensemble comprenant davantage d'informations à exploiter que l'ensemble de départ. La méthode selon l'invention trouve une application à la problématique spécifique des données de type séries temporelles collectées par échantillonnage. La méthode de l'invention présente une précision meilleure par rapport aux méthodes existantes puisque davantage d'informations sont exploitées simultanément. Notamment, la méthode selon l'invention n'introduit pas de biais, contrairement aux méthodes dynamiques connues.The method according to the invention thus advantageously makes it possible to estimate at least one missing value among the values collected and thus to obtain a set of values comprising both the values collected and at least one estimated value, thus a set comprising more than one value. 'information to exploit only the starting set. The method according to the invention finds an application to the specific problematic of time series type data collected by sampling. The method of the invention has a better accuracy compared to existing methods since more information is used simultaneously. In particular, the method according to the invention does not introduce bias, unlike known dynamic methods.

Selon un mode de réalisation, l'estimateur dynamique y ^ i , t , c d

Figure imgb0006
est calculé pour une configuration donnée de la valeur manquante, la configuration étant fonction de la longueur de la série de valeurs manquantes successives et de l'emplacement de la valeur manquante dans cette série ; et/ou l'estimateur statique y ^ i , t s
Figure imgb0007
est calculé pour une classe d'imputation donnée à laquelle appartient l'individu donné non répondant à l'instant donné.According to one embodiment, the dynamic estimator there ^ i , t , vs d
Figure imgb0006
is calculated for a given configuration of the missing value, the configuration being a function of the length of the series of successive missing values and the location of the missing value in this series; and / or the static estimator there ^ i , t s
Figure imgb0007
is calculated for a given imputation class to which the given individual who is not responding at the given moment belongs.

La méthode selon l'invention s'adapte en fonction de la performance relative des estimateurs à chaque instant et pour chaque type de données manquantes : les méthodes statiques sont meilleures s'il y a peu d'individus manquants à une date donnée, tandis que les méthodes dynamiques sont meilleures pour les petits trous, ou bien si la valeur manquante considérée se trouve au bord du trou. La méthode selon l'invention permet d'adapter la combinaison à la situation, en donnant plus de poids à l'estimateur dynamique pour les petits trous que pour les gros trous par exemple. Selon un premier mode de mise en oeuvre, la détermination de l'estimateur combiné y ^ i , t γ

Figure imgb0008
consiste en une combinaison linéaire des estimateurs statique y ^ i , t s
Figure imgb0009
et dynamique y ^ i , t d .
Figure imgb0010
The method according to the invention adapts according to the relative performance of the estimators at each moment and for each type of missing data: the static methods are better if there are few missing individuals at a given date, whereas dynamic methods are better for small holes, or if the missing value is at the edge of the hole. The method according to the invention makes it possible to adapt the combination to the situation, giving more weight to the dynamic estimator for small holes than for large holes, for example. According to a first mode of implementation, the determination of the combined estimator there ^ i , t γ
Figure imgb0008
consists of a linear combination of static estimators there ^ i , t s
Figure imgb0009
and dynamic there ^ i , t d .
Figure imgb0010

Par exemple, le procédé peut comprendre les étapes de :

  • pour chaque individu répondant à l'instant donné, calculs d'un estimateur dynamique y ^ , t , c d
    Figure imgb0011
    et d'un estimateur statique y ^ , t s ,
    Figure imgb0012
    et détermination d'un estimateur combiné y ^ , t γ
    Figure imgb0013
    comme la combinaison linéaire desdits estimateurs statique et dynamique : y ^ , t γ = a + s y ^ , t s + d y ^ , t d ;
    Figure imgb0014
  • détermination de coefficients de la combinaison linéaire à partir des individus répondants à l'instant donné, par régression linéaire des valeurs collectées yi',t à l'instant donné sur lesdits estimateurs statique y ^ , t s
    Figure imgb0015
    et dynamique y ^ , t , c d ;
    Figure imgb0016
  • détermination de l'estimateur combiné y ^ i , t γ
    Figure imgb0017
    pour l'individu donné non répondant à l'instant donné en appliquant lesdits coefficients à la combinaison linéaire des estimateurs statique y ^ i , t s
    Figure imgb0018
    et dynamique y ^ i , t d .
    Figure imgb0019
For example, the method may include the steps of:
  • for each individual responding at the given moment, calculations of a dynamic estimator there ^ ee' , t , vs d
    Figure imgb0011
    and a static estimator there ^ ee' , t s ,
    Figure imgb0012
    and determining a combined estimator there ^ ee' , t γ
    Figure imgb0013
    as the linear combination of said static and dynamic estimators: there ^ ee' , t γ = at + s there ^ ee' , t s + d there ^ ee' , t d ;
    Figure imgb0014
  • determining coefficients of the linear combination from the responding individuals at the given instant, by linear regression of the collected values y i ', t at the given instant on said static estimators there ^ ee' , t s
    Figure imgb0015
    and dynamic there ^ ee' , t , vs d ;
    Figure imgb0016
  • determination of the combined estimator there ^ i , t γ
    Figure imgb0017
    for the given individual not responding at the given moment by applying said coefficients to the linear combination of the static estimators there ^ i , t s
    Figure imgb0018
    and dynamic there ^ i , t d .
    Figure imgb0019

On peut calculer simultanément des valeurs manquantes de plusieurs individus non répondants. Pour chaque individu répondant, on calcule alors des estimateurs dynamiques pour chaque configuration de valeurs manquantes ; puis, pour chaque configuration, on détermine les coefficients de la combinaison linéaire correspondants à la configuration de valeur manquante considérée.Missing values of several nonresponding individuals can be calculated simultaneously. For each responding individual, dynamic estimators are then calculated for each missing value configuration; then, for each configuration, the coefficients of the linear combination corresponding to the missing value configuration considered are determined.

Selon un autre exemple, le procédé peut comprendre les étapes de :

  • pour chaque individu répondant à l'instant donné, calculs d'un estimateur dynamique y ^ i , t , c d
    Figure imgb0020
    et d'un estimateur statique y ^ , t s ,
    Figure imgb0021
    et calculs d'une perte dudit estimateur statique et d'une perte dudit estimateur dynamique, chaque perte L() étant calculée comme : L y ^ = r 1 - p ^ w p ^ E 2 ,
    Figure imgb0022

    avec i , la probabilité de réponse estimée de l'individu à l'instant donné, avec wi, le poids de sondage de l'individu, et
    avec Ei, l'erreur entre l'estimateur i',t et la valeur collectée yi',t pour ledit individu à l'instant donné ;
  • détermination d'un paramètre de combinaison ϕ c comme : φ c = L y ^ c d L y ^ c d + L y ^ s
    Figure imgb0023
  • détermination de l'estimateur combiné y ^ i , t γ
    Figure imgb0024
    pour l'individu donné non répondant à l'instant donné en appliquant le paramètre de combinaison ϕ c à la combinaison linéaire des estimateurs statique y ^ i , t s
    Figure imgb0025
    et dynamique y ^ i , t , c d
    Figure imgb0026
    comme suit : y ^ , t γ = φ c y ^ i , t s + 1 - φ c y ^ i , t d .
    Figure imgb0027
In another example, the method may comprise the steps of:
  • for each individual responding at the given moment, calculations of a dynamic estimator there ^ i , t , vs d
    Figure imgb0020
    and a static estimator there ^ ee' , t s ,
    Figure imgb0021
    and calculating a loss of said static estimator and a loss of said dynamic estimator, each loss L ( ŷ ) being calculated as: The there ^ = Σ r 1 - p ^ ee' w ee' p ^ ee' E ee' 2 ,
    Figure imgb0022

    with p i , the estimated probability of response of the individual at the given moment, with w i , the probing weight of the individual, and
    with E i , the error between the estimator ŷ i ', t and the value collected y i', t for the said individual at the given moment;
  • determining a combination parameter φ c such as: φ vs = The there ^ vs d The there ^ vs d + The there ^ s
    Figure imgb0023
  • determination of the combined estimator there ^ i , t γ
    Figure imgb0024
    for the given individual not responding at the given time by applying the combination parameter φ c to the linear combination of the static estimators there ^ i , t s
    Figure imgb0025
    and dynamic there ^ i , t , vs d
    Figure imgb0026
    as following : there ^ ee' , t γ = φ vs there ^ i , t s + 1 - φ vs there ^ i , t d .
    Figure imgb0027

De même, on peut calculer simultanément des valeurs manquantes de plusieurs individus non répondants. Pour chaque individu répondant, on calcule alors des estimateurs dynamiques pour chaque configuration de valeurs manquantes ; puis, pour chaque configuration, on détermine un paramètre de combinaison ϕ c correspondant à la configuration de valeur manquante considérée.Similarly, missing values of several nonresponding individuals can be calculated simultaneously. For each responding individual, dynamic estimators are then calculated for each missing value configuration; then, for each configuration, a combination parameter φ c corresponding to the missing value configuration considered is determined.

Selon un deuxième mode de mise en oeuvre, la détermination de l'estimateur combiné y ^ i , t γ

Figure imgb0028
consiste en une combinaison séquentielle des estimateurs statique y ^ i , t s
Figure imgb0029
et * dynamique y ^ i , t d .
Figure imgb0030
According to a second mode of implementation, the determination of the combined estimator there ^ i , t γ
Figure imgb0028
consists of a sequential combination of static estimators there ^ i , t s
Figure imgb0029
and * dynamic there ^ i , t d .
Figure imgb0030

Par exemple, le procédé peut comprendre les étapes de :

  • pour chaque individu répondant à l'instant donné, calcul d'un estimateur dynamique y ^ , t , c d ;
    Figure imgb0031
  • détermination de l'estimateur combiné y ^ i , t γ
    Figure imgb0032
    pour l'individu donné non répondant à l'instant donné comme l'estimateur statique y ^ i , t s
    Figure imgb0033
    de la valeur manquante calculée à partir de l'estimateur dynamique y ^ i , t d
    Figure imgb0034
    de l'individu non répondant et d'une relation estimée entre estimateurs dynamiques y ^ , t , c d
    Figure imgb0035
    et valeurs collectées yi',t sur les individus répondants à l'instant donné.
For example, the method may include the steps of:
  • for each individual responding at the given moment, calculating a dynamic estimator there ^ ee' , t , vs d ;
    Figure imgb0031
  • determination of the combined estimator there ^ i , t γ
    Figure imgb0032
    for the given individual not responding at the given moment as the static estimator there ^ i , t s
    Figure imgb0033
    value missing calculated from the dynamic estimator there ^ i , t d
    Figure imgb0034
    the nonrespondent individual and an estimated relationship between dynamic estimators there ^ ee' , t , vs d
    Figure imgb0035
    and values collected y i ', t on the individuals responding at the given moment.

De même, on peut calculer simultanément des valeurs manquantes de plusieurs individus non répondants. Pour chaque individu répondant, on calcule alors des estimateurs dynamiques pour chaque configuration de valeurs manquantes ; puis, pour chaque configuration, on détermine l'estimateur combiné à partir de l'estimateur dynamique et d'une relation estimée pour chaque configuration de valeur manquante considérée.Similarly, missing values of several nonresponding individuals can be calculated simultaneously. For each responding individual, dynamic estimators are then calculated for each missing value configuration; then, for each configuration, the combined estimator is determined from the dynamic estimator and an estimated relationship for each missing value configuration considered.

Selon un autre exemple, le procédé peut comprendre les étapes de :

  • pour chaque individu répondant à l'instant donné, calcul d'un estimateur dynamique y ^ , t , c d ;
    Figure imgb0036
  • comparaison de l'estimateur dynamique y ^ i , t d
    Figure imgb0037
    de l'individu donné non répondant à l'instant donné avec chaque estimateur dynamique y ^ , t , c d
    Figure imgb0038
    des individus répondants à l'instant donné, et détermination d'un plus proche voisin comme étant l'individu répondant à l'instant donné ayant estimateur dynamique y ^ , t , c d
    Figure imgb0039
    le plus proche de l'estimateur dynamique y ^ i , t d
    Figure imgb0040
    de l'individu donné non répondant à l'instant donné ;
  • détermination de l'estimateur combiné y ^ i , t γ
    Figure imgb0041
    pour l'individu donné non répondant à l'instant donné comme l'estimateur statique y ^ i , t s
    Figure imgb0042
    de la valeur manquante fixée à la valeur collectée yi',t du plus proche voisin à l'instant donné.
In another example, the method may comprise the steps of:
  • for each individual responding at the given moment, calculating a dynamic estimator there ^ ee' , t , vs d ;
    Figure imgb0036
  • comparison of the dynamic estimator there ^ i , t d
    Figure imgb0037
    of the given individual not responding at the given moment with each dynamic estimator there ^ ee' , t , vs d
    Figure imgb0038
    respondents at the given moment, and determination of a nearest neighbor as the individual responding at the given moment with dynamic estimator there ^ ee' , t , vs d
    Figure imgb0039
    closest to the dynamic estimator there ^ i , t d
    Figure imgb0040
    the given individual not responding at the given moment;
  • determination of the combined estimator there ^ i , t γ
    Figure imgb0041
    for the given individual not responding at the given moment as the static estimator there ^ i , t s
    Figure imgb0042
    the missing value set to the collected value y i ', t of the nearest neighbor at the given moment.

De même, on peut calculer simultanément des valeurs manquantes de plusieurs individus non répondants. Pour chaque individu répondant, on calcule alors des estimateurs dynamiques pour chaque configuration de valeurs manquantes ; puis, pour chaque configuration, on compare l'estimateur dynamique de l'individu non répondant avec chaque estimateur dynamique des individus répondants pour chaque configuration de valeur manquante considérée.Similarly, missing values of several nonresponding individuals can be calculated simultaneously. For each responding individual, dynamic estimators are then calculated for each missing value configuration; then, for each configuration, we compare the dynamic estimator of the non-responding individual with each dynamic estimator of the responding individuals for each missing value configuration considered.

Selon une application du procédé, les données collectées sont des données de consommation électrique.According to one application of the method, the data collected is electrical consumption data.

D'autres caractéristiques et avantages de l'invention apparaîtront à la lecture de la description détaillée ci-après, et des figures annexées qui représentent :

  • figure 1, une illustration d'une « non réponse » d'un individu donné à un instant donné parmi un ensemble de valeurs collectées ;
  • figure 2, des schémas illustrant la détermination d'un estimateur combiné selon l'invention pour une première configuration de données manquantes ;
  • figure 3, des schémas illustrant la détermination d'un estimateur combiné selon l'invention pour une deuxième configuration de données manquantes.
Other features and advantages of the invention will appear on reading the detailed description below, and the appended figures which represent:
  • figure 1 , an illustration of a "no answer" of a given individual at a given moment among a set of values collected;
  • figure 2 diagrams illustrating the determination of a combined estimator according to the invention for a first configuration of missing data;
  • figure 3 , diagrams illustrating the determination of a combined estimator according to the invention for a second configuration of missing data.

L'invention propose un procédé de détermination d'une valeur manquante avec un estimateur combiné à partir d'un estimateur statique et d'un estimateur dynamique.The invention provides a method of determining a missing value with a combined estimator from a static estimator and a dynamic estimator.

La figure 1 illustre la « non réponse » d'un individu i donné à un instant t donné parmi un ensemble de valeurs collectées pour n individus entre les instant 1 à T. Un estimateur va être déterminé pour cette valeur manquante à partir d'estimateurs statiques, c'est-à-dire fonction des données fournies par les autres individus i' répondants à l'instant t donné, et à partir d'estimateurs dynamiques, c'est-à-dire fonction des données collectées pour l'individu donné i à des instants précédents et suivants l'instant t donné.The figure 1 illustrates the "non response" of an individual i given at a given instant t among a set of values collected for n individuals between times 1 to T. An estimator will be determined for this missing value from static estimators, c ie, the data provided by the other respondents i at the given time t, and from dynamic estimators, ie the data collected for the given individual i to instants preceding and following the instant t given.

La présente invention recherche la combinaison optimale d'un ou plusieurs estimateurs statiques et d'un ou plusieurs estimateurs dynamiques.The present invention seeks the optimal combination of one or more static estimators and one or more dynamic estimators.

Selon un premier mode de mise en oeuvre, des méthodes dites « additives » sont considérées. On évalue la performance des différents estimateurs en recréant des trous sur les individus présents, et on définit l'estimateur combiné comme une combinaison linéaire des différents estimateurs dont les coefficients dépendent des performances constatées sur les individus présent, avec éventuellement une constante destinée à éliminer le biais induit par l'utilisation d'estimateurs dynamiques.According to a first mode of implementation, so-called "additive" methods are considered. The performance of the different estimators is evaluated by recreating holes on the individuals present, and the combined estimator is defined as a linear combination of the different estimators whose coefficients depend on the performances observed on the individuals present, with possibly a constant intended to eliminate the bias induced by the use of dynamic estimators.

Selon un deuxième mode de mise en oeuvre des méthodes dites « séquentielles » sont considérées. L'imputation dynamique est utilisée en entrée d'une méthode statique d'imputation. Les rôles des méthodes ne sont plus symétriques puisqu'on utilise un estimateur après l'autre.According to a second embodiment of so-called "sequential" methods are considered. Dynamic imputation is used as input to a static imputation method. The roles of the methods are no longer symmetrical since one estimator is used after another.

Quelle que soit la méthode retenue, la recherche de la combinaison optimale se fait séparément pour chaque triplet (horodate, classe d'imputation, configuration). En outre, lorsque l'imputation dynamique risque de donner de trop mauvais résultats (pour les courbes trop incomplètes ou encore les séries trop longues de valeurs manquantes), on utilisera l'estimateur statique au lieu d'un estimateur combiné.Whichever method is chosen, the search for the optimal combination is done separately for each triplet (time stamp, imputation class, configuration). In addition, when dynamic imputation is likely to give too poor results (for too incomplete curves or too long series of missing values), the static estimator will be used instead of a combined estimator.

Les figures 2 et 3 illustrent de tels triplets : instant t donné de la valeur manquante, configuration c de la valeur manquante et classe d'imputation k de l'individu i non répondant.The figures 2 and 3 illustrate such triplets: given t-time of the missing value, c-configuration of the missing value, and imputation class k of the nonresponding individual.

Dans toute la suite, nous appellerons « configuration de non réponse », ou plus simplement « configuration » d'une valeur manquante la longueur de la série de valeurs manquantes à laquelle elle appartient ainsi que sa position dans cette série. Ces configurations peuvent être regroupées pour limiter les calculs. Par exemple, une configuration peut être constituée des trous de longueur 1, une autre des trous de longueur 2, une autre des valeurs « proches des bords » (4 premiers manquants par exemple) dans des trous de longueur 10 à 20, une autre des valeurs « du milieu » des trous de longueur 10 à 20. Deux valeurs manquantes d'une même série n'appartiendront donc pas forcément à la même configuration : si le trou est relativement long, on séparera bien les valeurs manquantes proches du bord des valeurs manquantes de milieu de trou pour lesquelles l'incertitude est beaucoup plus grande. Le fait de tenir compte de la configuration de la valeur manquante lors de la détermination de la combinaison optimale des estimateurs permet de favoriser un estimateur par rapport à l'autre selon que le trou de valeurs manquantes est gros ou petit. Par exemple, les estimateurs dynamiques seront moins précis sur les gros trous que sur les petits trous, et au milieu du trou que sur les bords, alors que la précision des estimateurs statiques ne dépend pas de la configuration puisqu'on travaille séparément instant par instant (en revanche, elle dépend du taux de valeurs manquantes à l'instant considéré).In the following, we will call "configuration of no answer", or more simply "configuration" of a missing value the length of the series of missing values to which it belongs as well as its position in this series. These configurations can be grouped to limit calculations. For example, a configuration may consist of holes of length 1, another of holes of length 2, another of the values "close to the edges" (first 4 missing for example) in holes of length 10 to 20, another of "middle" values for holes with lengths 10 to 20. Two missing values of the same series will therefore not necessarily belong to the same configuration: if the hole is relatively long, we will separate the missing values close to the edge of the values. missing mid-hole for which uncertainty is much greater. Taking into account the configuration of the missing value when determining the optimal combination of estimators makes it possible to favor one estimator relative to the other depending on whether the hole of missing values is large or small. For example, dynamic estimators will be less accurate on large holes than on small holes, and in the middle of the hole than on the edges, while the accuracy of static estimators does not depend on the configuration since we work separately instant by moment (On the other hand, it depends on the rate of missing values at the moment considered).

En outre, chaque individu de l'échantillon considéré est contenu dans une classe d'imputation k. Les classes d'imputation sont homogènes et constituées au préalable. Par exemple, dans une application à la collecte de données relatives aux courbes de charge de consommation électrique, une classe d'imputation donnée contient des individus qui se ressemblent en termes de consommation (niveau, thermosensibilité,...) et de probabilité de non réponse.In addition, each individual of the sample considered is contained in an imputation class k. The imputation classes are homogeneous and previously constituted. For example, in an application to the collection of data relating to electric consumption load curves, a given imputation class contains individuals that are similar in terms of consumption (level, temperature sensitivity, ...) and probability of non-consumption. reply.

Quatre méthodes vont maintenant être décrites en détails. Il est entendu que ces méthodes ne sont pas limitatives. Les méthodes décrites sont destinée à traiter une non réponse partielle (individus dont certaines valeurs sont présentes et certaines manquantes) et pas une non réponse totale (individus pour lesquelles toutes les valeurs sont manquantes). Pour les points manquants issus d'une courbe individuelle possédant trop de valeurs manquantes et/ou compris dans une série de valeurs manquantes trop longue (ces deux cas étant définis par des seuils fixés par l'utilisateur), l'estimateur combiné sera remplacé par l'estimateur statique.Four methods will now be described in detail. It is understood that these methods are not limiting. The methods described are intended to treat a partial nonresponse (individuals whose values are present and some missing) and not a total nonresponse (individuals for whom all the values are missing). For missing points resulting from an individual curve with too many missing values and / or included in a series of missing values that are too long (both cases are defined by thresholds set by the user), the combined estimator will be replaced by the static estimator.

Dans la suite, on utilisera les notations suivantes :

  • Les individus sont indicés par i. Ils sont N dans la population et n dans l'échantillon, i.e. les individus dont on collecte les données.
  • Les horodates sont indicées par t allant de 1 à T.
  • Pour un individu i, on notera wi son poids de sondage (constant au cours du temps et égal à l'inverse de sa probabilité d'inclusion dans l'échantillon), yit sa consommation à l'instant t, ait son indicatrice de présence à l'instant t (qui vaut 1 ssi la donnée yit est connue et qui vaut 0 si la donnée yit est manquante).
  • On notera y ^ it d
    Figure imgb0043
    l'estimateur dynamique pour l'individu i à l'instant t. Celui-ci peut-être fourni pour les non répondants comme pour les répondants.
    Cet estimateur est dépendant de la configuration de la série de valeurs manquantes considérée, c'est pourquoi on parle en fait de y ^ it , c d :
    Figure imgb0044
    l'estimateur dynamique dans le cas d'une configuration de valeurs manquantes c. L'indice c sera parfois omis pour alléger les notations.
  • On notera y ^ it s
    Figure imgb0045
    l'estimateur statique pour l'individu i à l'instant t. Celui-ci peut être fourni pour les répondants comme les non répondants.
    Cet estimateur ne dépend pas de la configuration de valeurs manquantes puisqu'il est déterminé indépendamment instant par instant. Cet estimateur statique dépend de la classe d'imputation k de l'individu non répondant, c'est-à-dire que les individus répondants de sa classe d'imputation seront considérés.
  • On notera y ^ it , c γ
    Figure imgb0046
    l'estimateur combiné pour l'individu i à l'instant t dans la configuration de valeurs manquantes c.
  • Les classes d'imputation k seront indicées de 1 à K. Dans une optique de cohérence, elles seront les mêmes pour les prévisions statiques que pour les combinaisons. Les classes de non réponse (qui potentiellement peuvent être les mêmes) seront indicées de 1 à L.
In the following, we will use the following notations:
  • Individuals are indexed by i. They are N in the population and n in the sample, ie the individuals whose data are collected.
  • The timestamps are indexed by t ranging from 1 to T.
  • For an individual i, it is noted w i its design weight (constant over time and equal to the inverse of the probability of inclusion in the sample), it is consumption at the instant t, it has its presence indicator at time t (which is worth 1 if the data y it is known and which is worth 0 if the data y it is missing).
  • We will note there ^ it d
    Figure imgb0043
    the dynamic estimator for the individual i at time t. This can be provided for both non-respondents and respondents.
    This estimator is dependent on the configuration of the set of missing values considered, so we are talking about there ^ it , vs d :
    Figure imgb0044
    the dynamic estimator in the case of a configuration of missing values c. The index c will sometimes be omitted to reduce the ratings.
  • We will note there ^ it s
    Figure imgb0045
    the static estimator for the individual i at time t. This can be provided for both respondents and nonrespondents.
    This estimator does not depend on the configuration of missing values since it is determined independently instant by moment. This static estimator depends on the imputation class k of the nonrespondent individual, ie the responding individuals in its imputation class will be considered.
  • We will note there ^ it , vs γ
    Figure imgb0046
    the combined estimator for the individual i at time t in the configuration of missing values c.
  • The imputation classes k will be indexed from 1 to K. For the sake of consistency, they will be the same for static forecasts as for combinations. Nonresponse classes (which can potentially be the same) will be indexed from 1 to L.

Premier mode de réalisation : Combinaison par régression linéaireFirst Embodiment: Linear Regression Combination

Selon ce mode de réalisation, l'estimateur combinée de la valeur manquante sera une combinaison linéaire d'un (ou plusieurs) estimateurs dynamiques et d'un (ou plusieurs) estimateurs statiques.According to this embodiment, the combined estimator of the missing value will be a linear combination of one (or more) dynamic estimators and one (or more) static estimators.

Pour trouver les coefficients de la combinaison linéaire, on va utiliser les coefficients de la régression linéaire de la vraie valeur sur les valeurs prédites par les différents estimateurs statiques et dynamiques, séparément pour chaque triplet (configuration de non réponse, date, classe d'imputation). Cette régression comportera une constante, qui permettra d'absorber le biais induit par le modèle individuel dynamique à l'instant t. La combinaison se fera séparément pour chacune des classes d'imputation.To find the coefficients of the linear combination, one will use the coefficients of the linear regression of the true value on the values predicted by the different static and dynamic estimators, separately for each triplet (configuration of nonresponse, date, class of imputation ). This regression will include a constant, which will absorb the bias induced by the dynamic individual model at time t. The combination will be done separately for each imputation class.

Le modèle peut être le suivant : Y i = a + s y ^ i s + d y ^ i d + ε i

Figure imgb0047
The model can be the following: Y i = at + s there ^ i s + d there ^ i d + ε i
Figure imgb0047

Le modèle peut être estimé par « Moindres Carrés Ordinaires » séparément pour chaque triplet (date, classe, configuration de non réponse). L'estimateur statique reste le même pour toutes les configurations puisqu'il est calculé instant par instant sans tenir compte du reste de la courbe, mais l'estimateur dynamique change puisque, selon la configuration de non réponse, les données disponibles de la courbe ne sont pas les mêmes.The model can be estimated by "Least Ordinary Squares" separately for each triplet (date, class, nonresponse configuration). The static estimator remains the same for all the configurations since it is calculated instant by moment without taking into account the rest of the curve, but the dynamic estimator changes since, according to the non-response configuration, the available data of the curve are not the same.

L'estimateur combiné d'une valeur manquante pour un individu i à l'instant t sera alors donné par : y ^ i , t γ = a + s y ^ i , t s + d y ^ i , t d

Figure imgb0048
The combined estimator of a missing value for an individual i at time t will then be given by: there ^ i , t γ = at + s there ^ i , t s + d there ^ i , t d
Figure imgb0048

La mise en oeuvre de cette méthode peut être la suivante.The implementation of this method can be the following.

Pour un individu i non répondant à l'instant t, effectuer au moins une estimation statique y ^ i , t s

Figure imgb0049
et au moins une estimation dynamique y ^ i , t d .
Figure imgb0050
For an individual i not responding at time t, perform at least one static estimate there ^ i , t s
Figure imgb0049
and at least one dynamic estimate there ^ i , t d .
Figure imgb0050

Pour chaque individu i' répondant au même instant t, calculer au moins un estimateur statique y ^ , t s

Figure imgb0051
et au moins un estimateur dynamique y ^ , t d .
Figure imgb0052
Pour les estimateurs statiques, on considère les individus i' répondants de la même classe d'imputation que l'individu i non répondant pour lequel on recherche l'estimateur combiné, et on récupère la même valeur prédite quelle que soit la configuration de non réponse. Pour les estimateurs dynamiques, on récupèrera une valeur prédite différente pour chacune des configurations de non réponse étudiées. Par exemple, on « cache » les vraies valeurs autour de l'instant t considéré pour se retrouver dans la configuration de valeur manquante étudiée, puis ensuite on estime la valeur à l'instant considéré seulement à partir des valeurs non cachées. On exploite ainsi les prévisions dynamiques obtenues en reproduisant sur les individus i' répondants de la même classe la même configuration de non réponse que l'individu non répondant i au même instant.For each individual responding at the same time t, compute at least one static estimator there ^ ee' , t s
Figure imgb0051
and at least one dynamic estimator there ^ ee' , t d .
Figure imgb0052
For static estimators, individuals are considered to be respondents in the same imputation class as the nonresponding individual for whom the combined estimator is sought, and the same predicted value is retrieved regardless of the non-response configuration. . For dynamic estimators, a different predicted value will be obtained for each of the nonresponse configurations studied. For example, one "hides" the true values around the considered moment t to find oneself in the configuration of missing value studied, then one estimates the value at the instant considered only from the values not hidden. The dynamic forecasts obtained are thus exploited by reproducing on the individuals in the same class the same non-response configuration as the nonrespondent individual at the same time.

Sur l'ensemble des individus i' répondants à l'instant t, séparément pour chaque triplet (instant ; classe ; configuration), on régresse la vraie valeur yi',t à l'instant donné, (i.e. la valeur collectée de l'individu i' répondant à l'instant t) sur les valeurs des estimateurs y ^ , t s

Figure imgb0053
et y ^ , t d
Figure imgb0054
pour obtenir les coefficients a, s et d de combinaison. La régression linéaire entre des valeurs prédites et des valeurs réelles pour déterminer des coefficients de combinaison linéaire est décrite dans la publication de F.X. Diebold, "Serial correlation and the combination of forecasts", Journal of Business and Economic Statistics, 6, 105-111, 1988 .On the set of individuals i 'respondents at time t, separately for each triplet (instant, class, configuration), we regress the true value y i', t at the given moment, (ie the value collected from 'individual i' responding at time t) to the values of the estimators there ^ ee' , t s
Figure imgb0053
and there ^ ee' , t d
Figure imgb0054
to obtain the coefficients a, s and d of combination. The linear regression between predicted and actual values to determine linear combination coefficients is described in the publication of FX Diebold, "Serial Correlation and the Combination of Forecasts," Journal of Business and Economic Statistics, 6, 105-111, 1988 .

On peut alors attribuer un jeu de coefficient a, s, d approprié aux estimateurs statiques y ^ i , t s

Figure imgb0055
et dynamique y ^ i , t d
Figure imgb0056
de chaque individu i non répondant à l'instant t.We can then assign a set of coefficients a, s, d appropriate to the static estimators there ^ i , t s
Figure imgb0055
and dynamic there ^ i , t d
Figure imgb0056
of each individual i not responding at time t.

S'il n'est pas possible de trouver le jeu de coefficient pour un triplet (instant ; classe ; configuration), par exemple si tous les individus d'une même classe sont manquants simultanément, on utilise le modèle estimé sur le duo (instant ; configuration). Si c'est encore impossible, on peut utiliser le modèle sur tous les instants et toutes classes pour la configuration. Si jamais l'estimateur dynamique ne peut pas être calculé pour une date donnée (par exemple dans le cas du premier et/ou du dernier instant qui ne peuvent pas être corrigés par interpolation linéaire), on utilisera simplement l'estimateur statique.If it is not possible to find the coefficient set for a triplet (instant, class, configuration), for example if all the individuals of the same class are missing simultaneously, we use the estimated model on the duet (instant configuration). If it is still impossible, we can use the model on all instants and all classes for the configuration. If the dynamic estimator can never be calculated for a given date (for example, in the case of the first and / or last moment that can not be corrected by linear interpolation), we will simply use the static estimator.

Deuxième mode de réalisation : Combinaison par fonction de pertesSecond Embodiment: Combination by Loss Function

Selon ce mode de réalisation, l'estimateur combinée de la valeur manquante sera également une combinaison linéaire d'un (ou plusieurs) estimateurs dynamiques et d'un (ou plusieurs) estimateurs statiques.According to this embodiment, the combined missing value estimator will also be a linear combination of one (or more) dynamic estimators and one (or more) static estimators.

Cette méthode est proche de la précédente, puisqu'il s'agit toujours de trouver une combinaison linéaire des estimateurs statiques et dynamiques qui soit optimale. Selon ce deuxième mode de réalisation cependant, on va choisir un critère d'optimalité fondé sur la performance des estimateurs au niveau agrégé et non plus individuel car, dans le cadre d'une reconstitution des flux par exemple, l'objectif principal sera avant tout d'obtenir la meilleure estimation possible du total et non pas la meilleure prédiction individuelle.This method is close to the previous one, since it is always a question of finding a linear combination of the static and dynamic estimators which is optimal. According to this second embodiment, however, we will choose an optimality criterion based on the performance of the estimators at the aggregated level and no longer individually because, in the context of a reconstitution of the flows, for example, the main objective will be above all to obtain the best possible estimate of the total and not the best individual prediction.

Pour chaque instant t et chaque configuration c de non réponse, on va chercher le paramètre de combinaison ϕ t,c compris entre 0 et 1 tel que la prévision combinée y ^ i γ = φ y ^ i s + 1 - φ y ^ i d

Figure imgb0057

ait la meilleure performance possible au niveau collectif.For each instant t and each configuration c of no response, we will look for the combination parameter φ t, c between 0 and 1 such that the combined forecast there ^ i γ = φ there ^ i s + 1 - φ there ^ i d
Figure imgb0057

have the best possible performance at the collective level.

On calcule ainsi la perte L() de chaque estimateur, statique et dynamique, comme : L y ^ = r 1 - p ^ w p ^ E 2 ,

Figure imgb0058

avec i, la probabilité de réponse estimée de l'individu à l'instant donné (t), avec wi, le poids de sondage de l'individu, et
avec Ei, l'erreur entre l'estimateur i',t et la valeur collectée yi',t pour ledit individu répondant à l'instant donné.We calculate the loss L ( ŷ ) of each estimator, static and dynamic, as: The there ^ = Σ r 1 - p ^ ee' w ee' p ^ ee' E ee' 2 ,
Figure imgb0058

with p i , the estimated probability of response of the individual at the given instant (t), with w i , the probing weight of the individual, and
with E i , the error between the estimator ŷ i ', t and the value collected y i', t for said individual responding to the given instant.

L'estimateur est d'autant meilleur que la perte est faible, et de plus, le critère tient compte des poids de sondage et des probabilités de non réponse.The estimator is all the better if the loss is small, and moreover, the criterion takes into account the survey weights and the probabilities of non-response.

On détermine alors un paramètre de combinaison ϕ comme : φ = L y ^ d L y ^ d + L y ^ s

Figure imgb0059
We then determine a combination parameter φ such as: φ = The there ^ d The there ^ d + The there ^ s
Figure imgb0059

Ce paramètre exprime que plus la perte de l'estimateur dynamique sera forte par rapport à celle l'estimateur statique, plus le poids de l'estimateur statique sera fort.This parameter expresses that the greater the loss of the dynamic estimator compared to the static estimator, the greater the weight of the static estimator.

L'estimateur combiné y ^ i , t γ

Figure imgb0060
pour l'individu donné i non répondant à l'instant donné t pourra alors être déterminé en appliquant le paramètre de combinaison ϕ à la combinaison linéaire des estimateurs statique y ^ i , t s
Figure imgb0061
et dynamique y ^ i , t d
Figure imgb0062
dans l'équation (2) définie ci-dessus : y ^ , t γ = φ y ^ i , t s + 1 - φ y ^ i , t d .
Figure imgb0063
The combined estimator there ^ i , t γ
Figure imgb0060
for the given individual i not responding at the given instant t can then be determined by applying the combination parameter φ to the linear combination of the static estimators there ^ i , t s
Figure imgb0061
and dynamic there ^ i , t d
Figure imgb0062
in equation (2) defined above: there ^ ee' , t γ = φ there ^ i , t s + 1 - φ there ^ i , t d .
Figure imgb0063

L'estimateur combiné obtenu selon ce mode de réalisation ne sera pas sans biais car la combinaison d'estimateurs ne comporte pas de constante, le biais de l'estimation dynamique n'est donc pas corrigé. Ce biais sera cependant atténué par la combinaison linéaire, d'autant plus que, s'il est important, on peut penser que la perte de l'estimateur dynamique sera importante et donc son coefficient faible.The combined estimator obtained according to this embodiment will not be unbiased because the combination of estimators does not have a constant, the bias of the dynamic estimate is therefore not corrected. However, this bias will be attenuated by the linear combination, especially since, if it is important, one can think that the loss of the dynamic estimator will be important and therefore its low coefficient.

Les premier et deuxième modes de réalisation décrits ci-dessus donnaient un rôle symétrique aux estimateurs statiques et dynamiques. Les troisième et quatrième modes de réalisation décrits ci-dessous proposent de réaliser les estimations séquentiellement plutôt que simultanément.The first and second embodiments described above gave a symmetrical role to the static and dynamic estimators. The third and fourth embodiments described below provide for making the estimates sequentially rather than simultaneously.

Troisième mode de réalisation : Régression statique sur la prédiction dynamiqueThird Embodiment: Static Regression on Dynamic Prediction

On part du constat que l'estimateur dynamique contient une information très riche sur l'individu et fournit une bonne prévision de la consommation. L'information statique peut alors intervenir en complément de cette estimation dynamique, permettant de l'affiner en prenant en compte la spécificité de l'instant et en particulier de supprimer les biais instantanés non captés par les modèles dynamiques.We start from the observation that the dynamic estimator contains very rich information on the individual and provides a good forecast of consumption. The static information can then be used in addition to this dynamic estimate, allowing to refine it by taking into account the specificity of the moment and in particular to eliminate the instantaneous biases not captured by the dynamic models.

Pour ce faire, à chaque instant (et pour chaque configuration de non réponse), on va modéliser le lien entre les estimations dynamiques et les vraies valeurs des individus (c'est-à-dire modéliser l'erreur commise par l'estimateur dynamique) pour tenter de supprimer son biais.To do this, at each moment (and for each non-response configuration), we will model the link between the dynamic estimates and the real values of the individuals (that is to say, model the error made by the dynamic estimator ) to try to suppress its bias.

On postule une relation linéaire entre l'estimateur dynamique et la vraie valeur pour chaque individu i, par instant t, classe et configuration de valeur manquante. : y ^ i , t γ = d y ^ i , t d + a + ε i

Figure imgb0064

avec ε i suivant un bruit blanc.We postulate a linear relation between the dynamic estimator and the true value for each individual i, by instant t, class and configuration of missing value. : there ^ i , t γ = d there ^ i , t d + at + ε i
Figure imgb0064

with ε i following a white noise.

On pourrait complexifier ce modèle en rajoutant d'autres variables explicatives que la prédiction dynamique dans la régression, par exemple le niveau de consommation sur la période précédente.This model could be made more complex by adding other explanatory variables than the dynamic prediction in the regression, for example the level of consumption over the previous period.

La mise en oeuvre de cette méthode peut être la suivante.The implementation of this method can be the following.

Pour chaque individu i' répondant à l'instant t, dans la même classe d'imputation que l'individu i non répondant que pour lequel on recherche un estimateur combiné, on calcule, dans chaque configuration de valeur manquante, les estimateurs dynamiques y ^ , t d

Figure imgb0065
et on collecte les vrais valeurs yi',t . On peut alors déterminer par régression les coefficients d et a de la relation linéaire (5).For each individual responding at time t, in the same imputation class as the nonresponding individual for whom a combined estimator is sought, the dynamic estimators are computed in each missing value configuration. there ^ ee' , t d
Figure imgb0065
and the true values y i ', t are collected. The coefficients d and a of the linear relation (5) can then be determined by regression.

Puis, instant par instant, on utilise les estimations dynamiques d'un individu non répondant comme entrée de l'estimateur statique pour déterminer l'estimateur combiné selon la relation linéaire (5) et des coefficients déterminés par régression. La gestion des exceptions est la même que celle décrite en référence au premier mode de réalisation.Then, moment by moment, the dynamic estimates of a non-responding individual are used as the input of the static estimator to determine the combined estimator according to the linear relationship (5) and coefficients determined by regression. Exception handling is the same as that described with reference to the first embodiment.

Quatrième mode de réalisation : Le plus proche voisin sur estimation dynamiqueFourth embodiment: The nearest neighbor on dynamic estimate

On présente maintenant une variante non paramétrique du troisième mode de réalisation. On suppose toujours que, pour chaque configuration de valeur manquante, il existe une relation, constante classe par classe, entre la vraie valeur yi pour un individu i et l'estimateur dynamique y ^ i d

Figure imgb0066
mais on ne cherche pas à modéliser paramétriquement cette relation, ce qui permet d'être plus robuste, en évitant les problèmes liés à de mauvaises spécifications.We now present a non-parametric variant of the third embodiment. It is always assumed that, for each missing value configuration, there is a class-by-class relationship between the true value y i for an individual i and the dynamic estimator there ^ i d
Figure imgb0066
but we are not trying to model parametrically this relationship, which allows to be more robust, avoiding problems related to poor specifications.

Instant par instant, lorsqu'une consommation est manquante pour un individu i, on va la remplacer par celle yi',t de l'individu i' répondant de sa classe qui lui ressemble le plus sur un critère donné, appelé plus proche voisin. Ici, le critère de proximité sera la prévision dynamique pour la configuration de non réponse étudiée.Instant by moment, when a consumption is missing for an individual i, we will replace it by that y ', t of the individual i' respondent of his class which resembles him the most on a given criterion, called nearest neighbor . Here, the proximity criterion will be the dynamic forecast for the nonresponse configuration studied.

On cherche l'individu i' répondant qui, pour la configuration c de la valeur manquante considérée, présente un estimateur dynamique y ^ , t d

Figure imgb0067
le plus proche de l'estimateur dynamique y ^ i , t d
Figure imgb0068
de l'individu i non répondant considéré. L'estimateur combiné y ^ i , t γ
Figure imgb0069
pour l'individu i non répondant à l'instant donné t est alors l'estimateur statique de la valeur manquante fixée à la valeur collectée yi',t du plus proche voisin à l'instant donné.We look for the individual respondent who, for the configuration c of the missing value considered, presents a dynamic estimator there ^ ee' , t d
Figure imgb0067
closest to the dynamic estimator there ^ i , t d
Figure imgb0068
of the individual i nonrespondent considered. The combined estimator there ^ i , t γ
Figure imgb0069
for the individual i not responding at the given instant t is then the static estimator of the missing value set to the collected value y i ', t of the closest neighbor at the given moment.

Les méthodes décrites ci-dessus ne sont pas limitatives. Notamment, plusieurs estimateurs statiques et/ou dynamiques peuvent être pris en compte simultanément lors de la détermination d'un estimateur combiné pour un individu non répondant à un instant donné. De plus, d'autres variables peuvent être incorporées dans les modèles en compléments des estimateurs dynamiques et statiques. L'invention trouve notamment à s'appliquer dans le cadre de données manquantes dans des séries temporelles collectées par échantillonnage.The methods described above are not limiting. In particular, several static and / or dynamic estimators can be taken into account simultaneously when determining a combined estimator for a nonresponsive individual at a given time. In addition, other variables can be incorporated into the models as complements to dynamic and static estimators. The invention is particularly applicable in the context of missing data in time series collected by sampling.

Claims (10)

Procédé de détermination d'une valeur manquante parmi des données collectées pour une pluralité d'individus à une pluralité d'instants, la valeur manquante étant associée à un individu donné (i) non répondant à un instant donné (t), le procédé comprenant les étapes de : - calcul d'un estimateur dynamique y ^ i , t , c d
Figure imgb0070
de la valeur manquante à partir de valeurs collectées pour l'individu donné (i) à des instants précédents et suivants l'instant donné (t) ;
- calcul d'un estimateur statique y ^ i , t s
Figure imgb0071
de la valeur manquante à partir de valeurs relatives à des individus (i') répondants à l'instant donné (t) ;
- détermination d'un estimateur combiné y ^ i , t γ
Figure imgb0072
de la valeur manquante à partir de l'estimateur statique y ^ i , t s
Figure imgb0073
et de l'estimateur dynamique y ^ i , t , c d .
Figure imgb0074
A method of determining a missing value among data collected for a plurality of individuals at a plurality of times, the missing value being associated with a given individual (i) not responsive to a given instant (t), the method comprising the steps of: - calculation of a dynamic estimator there ^ i , t , vs d
Figure imgb0070
the missing value from values collected for the given individual (i) at preceding and following instants the given instant (t);
- calculation of a static estimator there ^ i , t s
Figure imgb0071
the missing value from values relating to individuals (i ') responding at the given moment (t);
- determination of a combined estimator there ^ i , t γ
Figure imgb0072
the missing value from the static estimator there ^ i , t s
Figure imgb0073
and the dynamic estimator there ^ i , t , vs d .
Figure imgb0074
Procédé selon la revendication 1, dans lequel l'estimateur dynamique y ^ i , t , c d
Figure imgb0075
est calculé pour une configuration (c) donnée de la valeur manquante, la configuration étant fonction de la longueur de la série de valeurs manquantes successives et de l'emplacement de la valeur manquante dans cette série.
The method of claim 1, wherein the dynamic estimator there ^ i , t , vs d
Figure imgb0075
is calculated for a given configuration (c) of the missing value, the configuration being a function of the length of the series of successive missing values and the location of the missing value in this series.
Procédé selon l'une des revendications 1 ou 2, dans lequel l'estimateur statique y ^ i , t s
Figure imgb0076
est calculé pour une classe d'imputation (k) donnée à laquelle appartient l'individu donné non répondant à l'instant donné.
Method according to one of claims 1 or 2, wherein the static estimator there ^ i , t s
Figure imgb0076
is calculated for a given imputation class (k) to which the given individual who is not responding at the given moment belongs.
Procédé selon l'une des revendications 1 à 3, dans lequel la détermination de l'estimateur combiné y ^ i , t y
Figure imgb0077
consiste en une combinaison linéaire des estimateurs statique y ^ i , t s
Figure imgb0078
et dynamique y ^ i , t , c d .
Figure imgb0079
Method according to one of claims 1 to 3, wherein the determination of the combined estimator there ^ i , t there
Figure imgb0077
consists of a linear combination of static estimators there ^ i , t s
Figure imgb0078
and dynamic there ^ i , t , vs d .
Figure imgb0079
Procédé selon la revendication 4, comprenant les étapes de : - pour chaque individu (i') répondant à l'instant donné (t), calculs d'un estimateur dynamique y ^ i , t , c d
Figure imgb0080
et d'un estimateur statique y ^ , t s ,
Figure imgb0081
et détermination d'un estimateur combiné y ^ , t γ
Figure imgb0082
comme la combinaison linéaire desdits estimateurs statique et dynamique : y ^ , t γ = a + s y ^ , t s + d y ^ i , t , c d ;
Figure imgb0083
- détermination de coefficients de la combinaison linéaire (a, s, d) à partir des individus (i') répondants à l'instant donné (t), par régression linéaire des valeurs collectées yi',t à l'instant donné (t) sur lesdits estimateurs statique y ^ , t s
Figure imgb0084
et dynamique y ^ i , t , c d ;
Figure imgb0085
- détermination de l'estimateur combiné y ^ i , t γ
Figure imgb0086
pour l'individu donné (i) non répondant à l'instant donné (t) en appliquant lesdits coefficients (a, s, d) à la combinaison linéaire des estimateurs statique y ^ i , t s
Figure imgb0087
et dynamique y ^ i , t , c d .
Figure imgb0088
The method of claim 4, comprising the steps of: for each individual (i ') responding at the given instant (t), calculations of a dynamic estimator there ^ i , t , vs d
Figure imgb0080
and a static estimator there ^ ee' , t s ,
Figure imgb0081
and determining a combined estimator there ^ ee' , t γ
Figure imgb0082
as the linear combination of said static and dynamic estimators: there ^ ee' , t γ = at + s there ^ ee' , t s + d there ^ i , t , vs d ;
Figure imgb0083
determination of coefficients of the linear combination (a, s, d) from the individuals (i ') responding at the given instant (t), by linear regression of the collected values y i', t at the given instant ( t) on said static estimators there ^ ee' , t s
Figure imgb0084
and dynamic there ^ i , t , vs d ;
Figure imgb0085
- determination of the combined estimator there ^ i , t γ
Figure imgb0086
for the given individual (i) not responding at the given instant (t) by applying said coefficients (a, s, d) to the linear combination of the static estimators there ^ i , t s
Figure imgb0087
and dynamic there ^ i , t , vs d .
Figure imgb0088
Procédé selon la revendication 4, comprenant les étapes de : - pour chaque individu (i') répondant à l'instant donné (t), calculs d'un estimateur dynamique y ^ , t , c d
Figure imgb0089
et d'un estimateur statique y ^ , t s ,
Figure imgb0090
et calculs d'une perte dudit estimateur statique et d'une perte dudit estimateur dynamique, chaque perte L() étant calculée comme : L y ^ = r 1 - p ^ w p ^ E 2 ,
Figure imgb0091

avec i , la probabilité de réponse estimée de l'individu à l'instant donné (t), avec wi, le poids de sondage de l'individu, et
avec Ei, l'erreur entre l'estimateur i',t et la valeur collectée yi,t pour ledit individu à l'instant donné ;
- détermination d'un paramètre de combinaison ϕ c comme : φ c = L y ^ c d L y ^ c d + L y ^ s
Figure imgb0092
- détermination de l'estimateur combiné y ^ i , t y
Figure imgb0093
pour l'individu donné (i) non répondant à l'instant donné (t) en appliquant le paramètre de combinaison ϕ c à la combinaison linéaire des estimateurs statique y ^ i , t s
Figure imgb0094
et dynamique y ^ i , t , c d
Figure imgb0095
comme suit : y ^ , t γ = φ c y ^ i , t s + 1 - φ c y ^ i , t , c d .
Figure imgb0096
The method of claim 4, comprising the steps of: for each individual (i ') responding at the given instant (t), calculations of a dynamic estimator there ^ ee' , t , vs d
Figure imgb0089
and a static estimator there ^ ee' , t s ,
Figure imgb0090
and calculating a loss of said static estimator and a loss of said dynamic estimator, each loss L ( ŷ ) being calculated as: The there ^ = Σ r 1 - p ^ ee' w ee' p ^ ee' E ee' 2 ,
Figure imgb0091

with p i , the estimated probability of response of the individual at the given instant (t), with w i , the probing weight of the individual, and
with E i , the error between the estimator ŷ i ', t and the value collected y i, t for said individual at the given moment;
determination of a combination parameter φ c such as: φ vs = The there ^ vs d The there ^ vs d + The there ^ s
Figure imgb0092
- determination of the combined estimator there ^ i , t there
Figure imgb0093
for the given individual (i) not responding at the given instant (t) by applying the combination parameter φ c to the linear combination of static estimators there ^ i , t s
Figure imgb0094
and dynamic there ^ i , t , vs d
Figure imgb0095
as following : there ^ ee' , t γ = φ vs there ^ i , t s + 1 - φ vs there ^ i , t , vs d .
Figure imgb0096
Procédé selon l'une des revendications 1 à 3, dans lequel la détermination de l'estimateur combiné y ^ i , t y
Figure imgb0097
consiste en une combinaison séquentielle des estimateurs statique y ^ i , t s
Figure imgb0098
et dynamique y ^ i , t d .
Figure imgb0099
Method according to one of claims 1 to 3, wherein the determination of the combined estimator there ^ i , t there
Figure imgb0097
consists of a sequential combination of static estimators there ^ i , t s
Figure imgb0098
and dynamic there ^ i , t d .
Figure imgb0099
Procédé selon la revendication 7, comprenant les étapes de : - pour chaque individu (i') répondant à l'instant donné (t), calcul d'un estimateur dynamique y ^ , t d ;
Figure imgb0100
- détermination de l'estimateur combiné y ^ i , t γ
Figure imgb0101
pour l'individu donné (i) non répondant à l'instant donné (t) comme l'estimateur statique y ^ i , t s
Figure imgb0102
de la valeur manquante calculée à partir de l'estimateur dynamique y ^ i , t d
Figure imgb0103
de l'individu non répondant et d'une relation estimée entre estimateurs dynamiques y ^ , t d
Figure imgb0104
et valeurs collectées yi',t sur les individus (i') répondants à l'instant donné (t).
The method of claim 7, comprising the steps of: for each individual (i ') responding at the given instant (t), calculating a dynamic estimator there ^ ee' , t d ;
Figure imgb0100
- determination of the combined estimator there ^ i , t γ
Figure imgb0101
for the given individual (i) not responding at the given moment (t) as the static estimator there ^ i , t s
Figure imgb0102
the missing value calculated from the dynamic estimator there ^ i , t d
Figure imgb0103
the nonrespondent individual and an estimated relationship between dynamic estimators there ^ ee' , t d
Figure imgb0104
and values collected y i ', t on the individuals (i') respondents at the given moment (t).
Procédé selon la revendication 7, comprenant les étapes de : - pour chaque individu (i') répondant à l'instant donné (t), calcul d'un estimateur dynamique y ^ , t , c d
Figure imgb0105
- comparaison de l'estimateur dynamique y ^ i , t d
Figure imgb0106
de l'individu donné (i) non répondant à l'instant donné (t) avec chaque estimateur dynamique y ^ , t , c d
Figure imgb0107
des individus (i') répondants à l'instant donné (t), et détermination d'un plus proche voisin comme étant l'individu (i') répondant à l'instant donné (t) ayant estimateur dynamique y ^ , t d
Figure imgb0108
le plus proche de l'estimateur dynamique y ^ , t , c d
Figure imgb0109
de l'individu donné (i) non répondant à l'instant donné (t) ;
- détermination de l'estimateur combiné y ^ i , t γ
Figure imgb0110
pour l'individu donné (i) non répondant à l'instant donné (t) comme l'estimateur statique y ^ i , t s
Figure imgb0111
de la valeur manquante fixée à la valeur collectée yi',t du plus proche voisin à l'instant donné (t).
The method of claim 7, comprising the steps of: for each individual (i ') responding at the given instant (t), calculating a dynamic estimator there ^ ee' , t , vs d
Figure imgb0105
- comparison of the dynamic estimator there ^ i , t d
Figure imgb0106
of the given individual (i) not responding at the given moment (t) with each dynamic estimator there ^ ee' , t , vs d
Figure imgb0107
individuals (i ') responding at the given instant (t), and determining a nearest neighbor as being the individual (i') responding at the given instant (t) having a dynamic estimator there ^ ee' , t d
Figure imgb0108
closest to the dynamic estimator there ^ ee' , t , vs d
Figure imgb0109
the given individual (i) not responding at the given moment (t);
- determination of the combined estimator there ^ i , t γ
Figure imgb0110
for the given individual (i) no responding at the given moment (t) as the static estimator there ^ i , t s
Figure imgb0111
the missing value set to the collected value y i ', t of the nearest neighbor at the given instant (t).
Procédé selon l'une quelconque des revendications précédentes, dans lequel les données collectées sont des données de consommation électrique.The method of any one of the preceding claims, wherein the collected data is power consumption data.
EP13170953.7A 2012-06-25 2013-06-06 Method for determining a missing value among data collected for a plurality of individuals at a plurality of times Withdrawn EP2680158A3 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR1256016A FR2992428B1 (en) 2012-06-25 2012-06-25 METHOD OF DETERMINING A MISSING VALUE AMONG DATA COLLECTED FOR A PLURALITY OF INDIVIDUALS TO A PLURALITY OF MOMENTS

Publications (2)

Publication Number Publication Date
EP2680158A2 true EP2680158A2 (en) 2014-01-01
EP2680158A3 EP2680158A3 (en) 2015-01-07

Family

ID=47227903

Family Applications (1)

Application Number Title Priority Date Filing Date
EP13170953.7A Withdrawn EP2680158A3 (en) 2012-06-25 2013-06-06 Method for determining a missing value among data collected for a plurality of individuals at a plurality of times

Country Status (2)

Country Link
EP (1) EP2680158A3 (en)
FR (1) FR2992428B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9684872B2 (en) 2014-06-25 2017-06-20 International Business Machines Corporation Method and apparatus for generating data in a missing segment of a time data sequence
CN112199362A (en) * 2020-10-14 2021-01-08 北京理工大学 Filling method and system for database data loss under MES background

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6862540B1 (en) * 2003-03-25 2005-03-01 Johnson Controls Technology Company System and method for filling gaps of missing data using source specified data

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
F.X. DIEBOLD: "Serial corrélation and the combination of forecasts", JOURNAL OF BUSINESS AND ECONOMIC STATISTICS, vol. 6, 1988, pages 105 - 111
P. ARDILLY: "Techniques de sondages", 2006
R.T. CLEMEN: "Combining forecasts: A review and annotated bibliography", INTERNATIONAL JOURNAL OF FORECASTING, 1989, pages 559 - 583

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9684872B2 (en) 2014-06-25 2017-06-20 International Business Machines Corporation Method and apparatus for generating data in a missing segment of a time data sequence
CN112199362A (en) * 2020-10-14 2021-01-08 北京理工大学 Filling method and system for database data loss under MES background

Also Published As

Publication number Publication date
FR2992428B1 (en) 2014-07-18
FR2992428A1 (en) 2013-12-27
EP2680158A3 (en) 2015-01-07

Similar Documents

Publication Publication Date Title
Garcia-Gavilanes et al. Weighted content based methods for recommending connections in online social networks
FR2867584A1 (en) Internet user behavioral profile determining method, involves determining probability that user to be identified presents given attribute as combination of non-correlated and correlated probability values
US20160078148A1 (en) Estimating similarity of nodes using all-distances sketches
US20140067817A1 (en) Methods and systems for recommending social network connections
CN107516279A (en) A kind of method of network public-opinion automatic early-warning
EP3343839A1 (en) Mechanism for monitoring and alerts of computer system applications
EP3688458A1 (en) Improved detection and characterization of anomalies in a continuum of water
EP2785553B1 (en) Method for estimating the energy consumption of a motor vehicle
EP2680158A2 (en) Method for determining a missing value among data collected for a plurality of individuals at a plurality of times
WO2014096702A1 (en) Locating of one or more defects in an electrochemical assembly
EP3557714A1 (en) Method for associating each counter of a plurality of counters at a triphase departure of a transformer, method of determining the topology of a network and associated device
Östberg et al. Benefit Transfer for Environmental Improvements in Coastal Areas: General versus Best‐Fitting Models
WO2019063648A1 (en) Improved detection and characterization of anomalies in a continuum of water
EP2513827A1 (en) Method and device for determining a risk of graft rejection
EP3343371B1 (en) Device and method for monitoring and allocating resources of it infrastructures
EP2667208B1 (en) Electronic integrated sensor system, method of estimating the value of a functional physical quantity and a corresponding computer program
Andres et al. Overcoming missing data bias in water utility indicators by using nested balanced panels
FR2949157A1 (en) PROCESS FOR APPROXIMATING WEATHER VARIABLES
EP3265915B1 (en) Simulation device
Garbinti et al. Les justifications empiriques de la compensation financière après divorce
WO2019086782A1 (en) Method, device and program for composing an ordered list of recommended elements
FR3020484A1 (en) ESTIMATING THE ENERGY CONSUMPTION OF A FACILITY
FR3104294A1 (en) Method of forecasting a physical quantity of interest, associated management method and device
FR3107955A1 (en) Detection of an abnormal metrological drift of a fluid meter
Petrovic et al. A new statistical approach to estimate global file populations in the eDonkey P2P file sharing system

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

AK Designated contracting states

Kind code of ref document: A2

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

AX Request for extension of the european patent

Extension state: BA ME

PUAL Search report despatched

Free format text: ORIGINAL CODE: 0009013

AK Designated contracting states

Kind code of ref document: A3

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

AX Request for extension of the european patent

Extension state: BA ME

RIC1 Information provided on ipc code assigned before grant

Ipc: G06F 17/18 20060101AFI20141201BHEP

Ipc: H04Q 9/00 20060101ALI20141201BHEP

17P Request for examination filed

Effective date: 20150706

RBV Designated contracting states (corrected)

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20190103